发明授权
- 专利标题: 一种基于深度学习的文档主题向量抽取方法
-
申请号: CN201810748564.1申请日: 2018-07-10
-
公开(公告)号: CN108984526B公开(公告)日: 2021-05-07
- 发明人: 高扬 , 黄河燕 , 陆池
- 申请人: 北京理工大学
- 申请人地址: 北京市海淀区中关村南大街5号
- 专利权人: 北京理工大学
- 当前专利权人: 北京理工大学
- 当前专利权人地址: 北京市海淀区中关村南大街5号
- 代理机构: 北京正阳理工知识产权代理事务所
- 代理商 唐华
- 主分类号: G06F40/30
- IPC分类号: G06F40/30 ; G06F40/258 ; G06F40/284 ; G06N3/04 ; G06N3/08
摘要:
本发明涉及一种基于深度学习的文档主题向量抽取方法,属于自然语言处理技术领域。本发明方法利用卷积神经网络抽取出具有局部的深层的语义信息,利用LSTM模型将时序信息学习出来,使得向量的语义更加全面,选用上下文短语和文档主题的隐含的共现关系,避免了一些基于句子的主题向量模型对于短文本的缺点,利用注意力机制将CNN和LSTM模型有机的结合起来,学习了上下文的深层语义、时序信息和显著信息,更有效的构建了档主题向量抽取的模型。
公开/授权文献
- CN108984526A 一种基于深度学习的文档主题向量抽取方法 公开/授权日:2018-12-11