- 专利标题: 一种基于自注意力的观点及其持有者的联合抽取方法
-
申请号: CN201810347840.3申请日: 2018-04-18
-
公开(公告)号: CN108628828A公开(公告)日: 2018-10-09
- 发明人: 李雄 , 刘春阳 , 张传新 , 张旭 , 王萌 , 闫昊 , 唐彬
- 申请人: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
- 申请人地址: 北京市朝阳区裕民路甲3号
- 专利权人: 国家计算机网络与信息安全管理中心,北京航空航天大学
- 当前专利权人: 国家计算机网络与信息安全管理中心,北京航空航天大学
- 当前专利权人地址: 北京市朝阳区裕民路甲3号
- 代理机构: 北京慧泉知识产权代理有限公司
- 代理商 王顺荣; 唐爱华
- 主分类号: G06F17/27
- IPC分类号: G06F17/27 ; G06F17/30
摘要:
本发明一种基于自注意力的观点及其持有者的联合抽取方法:S1.构建提取观点及其持有者的语料集;S2.识别包含观点的语句;S3.联合抽取观点及其持有者。本发明优点:1、文本分类模型避免了抽取出的句子不包含观点的情况;2、观点及其持有者联合抽取模型摆脱了词性标注、命名实体识别和句法依存分析等自然语言处理环节,避免这些环节出现误差对模型提取效果的影响,且该模型有很高灵活度和覆盖面;3、本发明包含构建提取观点及其持有者的语料集,识别包含观点的语句,联合抽取观点及其持有者。4、本发明在双向LSTM的基础上使用self-attention有效结合两者优点,使词语序列的表示语义更丰富,训练的模型准确率更高。
公开/授权文献
- CN108628828B 一种基于自注意力的观点及其持有者的联合抽取方法 公开/授权日:2022-04-01