- 专利标题: 基于多语注意力机制的事件识别及分类方法及装置
- 专利标题(英): Multilingual attention mechanism-based event identification and classification method and apparatus
-
申请号: CN201711463578.0申请日: 2017-12-28
-
公开(公告)号: CN108345583A公开(公告)日: 2018-07-31
- 发明人: 陈玉博 , 刘康 , 赵军 , 刘健
- 申请人: 中国科学院自动化研究所
- 申请人地址: 北京市海淀区中关村东路95号
- 专利权人: 中国科学院自动化研究所
- 当前专利权人: 中国科学院自动化研究所
- 当前专利权人地址: 北京市海淀区中关村东路95号
- 代理机构: 北京瀚仁知识产权代理事务所
- 代理商 郭文浩; 陈晓鹏
- 主分类号: G06F17/27
- IPC分类号: G06F17/27 ; G06N3/08
摘要:
本发明涉及自然语言处理技术领域,具体涉及一种基于多语注意力机制的事件识别及分类方法及装置,旨在为了解决单语特征识别效果不能满足需求的问题,本发明的方法包括:将仅标注单语事件信息的数据映射为多语平行数据;将所述多语平行数据进行词汇级别对齐,通过多语对齐关系得到同一事件在多种不同语言中的一致性表示;基于单语注意力模型获取多语一致性信息;基于多语注意力模型获取多语互补性信息;基于所述多语一致性信息和所述多语互补性信息进行联合推理,通过非线性神经网络判别模型输出最终的识别结果。本发明可以提高事件的识别效果。
公开/授权文献
- CN108345583B 基于多语注意力机制的事件识别及分类方法及装置 公开/授权日:2020-07-28