- 专利标题: 基于在线增量演化主题模型的软件自动分类方法
- 专利标题(英): Online-increment evolution topic model based automatic software classifying method
-
申请号: CN201210097171.1申请日: 2012-04-05
-
公开(公告)号: CN102902700B公开(公告)日: 2015-02-25
- 发明人: 尹刚 , 王怀民 , 朱沿旭 , 余跃 , 史殿习 , 李翔 , 王涛 , 袁霖
- 申请人: 中国人民解放军国防科学技术大学
- 申请人地址: 湖南省长沙市开福区砚瓦池正街47号
- 专利权人: 中国人民解放军国防科学技术大学
- 当前专利权人: 中国人民解放军国防科学技术大学
- 当前专利权人地址: 湖南省长沙市开福区砚瓦池正街47号
- 代理机构: 北京安博达知识产权代理有限公司
- 代理商 徐国文
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
一种基于在线增量演化主题模型的软件自动分类方法,包括获取软件相关文本,以预定时间片进行分组和预处理;生成在线演化主题模型的概率模型,针对以时间片分组的项目描述文本,计算最优主题个数,增量式计算当前时间片内项目描述文本的主题词汇分布和主题文本分布;获取未知分类主题的文本d,根据主题词汇分布和主题文本分布计算文本d从属的n个主题的主题词汇分布,所述文本d分类到相应的主题中基于词汇表和基于词汇本体查询,为主题自动添加语义标签,最终完成软件项目的分类。能够及时发现开源社区出现的新主题,并对软件项目进行自动分类,方便软件开发者依据软件主题搜索需要的开源软件项目,从而提高软件开发的效率,提高开源社区质量和保障。
公开/授权文献
- CN102902700A 基于在线增量演化主题模型的软件自动分类方法 公开/授权日:2013-01-30