一种基于语境表征的中文网络暴力语言检测方法及系统
摘要:
本发明公开了一种基于语境表征的中文网络暴力语言检测方法及系统,包括:获取当前用户的网络评论数据;构建暴力语言敏感禁止词典;构建暴力语言检测模型,通过预训练模型NEZHA对当前用户的网络评论数据进行词嵌入编码,对文本进行上下文建模,提取文本的特征表示;将文本的向量表示输入到BiLSTM层,捕获长距离依赖;采用一个全连接网络进行输出连接;通过softmax函数输出分析结果,判断数据是否为网络禁止语言以及是否提示用户修改评论,并判断是否跳出检测流程得到检测结果。本发明基于语境表征的中文网络暴力语言检测方法,面向中文理解的神经语境表征模型,对于中文网络暴力语言具有更好的检测性能以及通用性。
0/0