一种基于深度学习的化妆品舆情文本实体关系抽取方法

    公开(公告)号:CN115374778A

    公开(公告)日:2022-11-22

    申请号:CN202211010810.6

    申请日:2022-08-23

    摘要: 本发明涉及一种基于深度学习的化妆品舆情文本实体关系抽取方法,包括:对互联网上爬取到的化妆品风险舆情文本信息进行预处理,并构建化妆品领域词库,通过改进的BERT神经网络提取字维度文本特征,并与词嵌入的词维度信息融合,经过融合位置感知注意力机制的BLSTM网络计算出多分类信息,再整合到改进的BERT神经网络提取字维度文本向量中再次经过融合位置感知注意力机制的BLSTM计算,最终通过CRF计算最优概率,完成化妆品风险舆情文本关系抽取。本发明一定程度上解决了化妆品风险舆情文本关系抽取准确程度不高,领域性强的难题,通过构建新的模型,在融合中文部首信息的字维度的基础上再加入词维度进行辅助表示,提高事件信息抽取准确性。