一种基于语境表征的中文网络暴力语言检测方法及系统

Invention Publication

CN116796732A 一种基于语境表征的中文网络暴力语言检测方法及系统审中-实审

Please log in to see more content

Patent Title: 一种基于语境表征的中文网络暴力语言检测方法及系统
Application No.: CN202310423711.9

Application Date: 2023-04-19
Publication No.: CN116796732A

Publication Date: 2023-09-22
Inventor: 王栋 , 梁晓静 , 许子鑫
Applicant: 上海应用技术大学
Applicant Address: 上海市奉贤区海泉路100号
Assignee: 上海应用技术大学
Current Assignee: 上海应用技术大学
Current Assignee Address: 上海市奉贤区海泉路100号
Agency: 南京禹为知识产权代理事务所
Agent 曹洪
Main IPC: G06F40/242
IPC: G06F40/242 ; G06F40/211 ; G06F40/30 ; G06F16/951 ; G06N3/0442

Abstract:

本发明公开了一种基于语境表征的中文网络暴力语言检测方法及系统，包括：获取当前用户的网络评论数据；构建暴力语言敏感禁止词典；构建暴力语言检测模型，通过预训练模型NEZHA对当前用户的网络评论数据进行词嵌入编码，对文本进行上下文建模，提取文本的特征表示；将文本的向量表示输入到BiLSTM层，捕获长距离依赖；采用一个全连接网络进行输出连接；通过softmax函数输出分析结果，判断数据是否为网络禁止语言以及是否提示用户修改评论，并判断是否跳出检测流程得到检测结果。本发明基于语境表征的中文网络暴力语言检测方法，面向中文理解的神经语境表征模型，对于中文网络暴力语言具有更好的检测性能以及通用性。

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F40/00	处理自然语言数据（语音分析或综合，语音识别G10L）
G06F40/20	.自然语言分析（自然语言的语义分析入G06F40/30）
G06F40/237	..词汇工具
G06F40/242	...词典