发明授权
- 专利标题: 一种基于突发事件的词向量语言模型
-
申请号: CN201910915299.6申请日: 2019-09-26
-
公开(公告)号: CN110688485B公开(公告)日: 2022-03-11
- 发明人: 赵鑫 , 朱秋昱 , 张明
- 申请人: 中国人民大学 , 杭州笔声智能科技有限公司
- 申请人地址: 北京市海淀区中关村大街59号;
- 专利权人: 中国人民大学,杭州笔声智能科技有限公司
- 当前专利权人: 中国人民大学,杭州笔声智能科技有限公司
- 当前专利权人地址: 北京市海淀区中关村大街59号;
- 代理机构: 北京邦创至诚知识产权代理事务所
- 代理商 张宇锋
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F40/30 ; G06F40/289 ; G06K9/62 ; G06N3/04
摘要:
本发明提供了一种基于突发事件的词向量语言模型,所述语言模型使用传统的Word2Vec模型对上下文进行训练,所述训练包括在模型的输入层计算出输入的隐藏层信息同时在输入层加入突发事件的向量表示将和通过加权求和得到最终的隐藏层表示使二者共同影响最终隐藏层表示,生成的隐藏层表示不仅与所述上下文相关,而且和所述突发事件相关。本发明提出了一种新的与突发事件相关的词向量模型,用于包含突发事件的文本流数据建模。本发明能够学习带有突发事件特点的词向量模型来识别语义变化,并且加入了突发事件向量表示来提高语义相关性。
公开/授权文献
- CN110688485A 一种基于突发事件的词向量语言模型 公开/授权日:2020-01-14