-
公开(公告)号:CN103336806A
公开(公告)日:2013-10-02
申请号:CN201310253678.6
申请日:2013-06-24
Applicant: 北京工业大学
Abstract: 本发明提出一种基于通过词出现间距的内在与外在模式的信息熵差进行关键词排序的方法,属于文字信息处理领域。本方法认为关键词的出现受到两个模式的影响:(1)内在模式,描述在一个话题中的关键词位置的统计特性;(2)外在模式,描述文本中话题簇出现的统计属性。真实文本上实验结果发现,一个词出现间距的内外模式和外在模式信息熵差越大,那么他是关键词的可能性也就越大。
-
公开(公告)号:CN103336806B
公开(公告)日:2016-08-10
申请号:CN201310253678.6
申请日:2013-06-24
Applicant: 北京工业大学
Abstract: 本发明提出一种基于通过词出现间距的内在与外在模式的信息熵差进行关键词排序的方法,属于文字信息处理领域。本方法认为关键词的出现受到两个模式的影响:(1)内在模式,描述在一个话题中的关键词位置的统计特性;(2)外在模式,描述文本中话题簇出现的统计属性。真实文本上实验结果发现,一个词出现间距的内外模式和外在模式信息熵差越大,那么他是关键词的可能性也就越大。
-