发明公开
- 专利标题: 一种基于图和词句协同的关键词提取方法及装置
- 专利标题(英): Keyword extraction method and device based on graph and word and sentence collaboration
-
申请号: CN201910334804.8申请日: 2019-04-24
-
公开(公告)号: CN110083835A公开(公告)日: 2019-08-02
- 发明人: 熊翱 , 郭庆 , 邱雪松 , 孟洛明 , 刘德荣
- 申请人: 北京邮电大学
- 申请人地址: 北京市海淀区西土城路10号
- 专利权人: 北京邮电大学
- 当前专利权人: 北京邮电大学
- 当前专利权人地址: 北京市海淀区西土城路10号
- 代理机构: 北京柏杉松知识产权代理事务所
- 代理商 丁芸; 项京
- 主分类号: G06F17/27
- IPC分类号: G06F17/27
摘要:
本发明实施例提供了一种基于图和词句协同的关键词提取方法及装置,其中方法包括:基于从待提取关键词的文本中得到的候选词和句子,计算每两个候选词对应的扩散度,基于扩散度计算无向有权图中每两个候选词之间边的第一权重,再基于第一权重计算各候选词的第一指标,计算有向有权图中每两个句子之间边的第二权重,基于第二权重计算各句子的第二指标,基于句子的第二指标得到句子的第一指标向量,进而基于各候选词的第一指标和所得到的第一指标向量构建各候选词的包含该候选词第五指标的第二指标向量,再基于第二指标向量中各第五指标的大小顺序,提取文本中的关键词。本发明实施例,能够提高提取文本中关键词的准确程度。