基于在线增量演化主题模型的软件自动分类方法
摘要:
一种基于在线增量演化主题模型的软件自动分类方法,包括获取软件相关文本,以预定时间片进行分组和预处理;生成在线演化主题模型的概率模型,针对以时间片分组的项目描述文本,计算最优主题个数,增量式计算当前时间片内项目描述文本的主题词汇分布和主题文本分布;获取未知分类主题的文本d,根据主题词汇分布和主题文本分布计算文本d从属的n个主题的主题词汇分布,所述文本d分类到相应的主题中基于词汇表和基于词汇本体查询,为主题自动添加语义标签,最终完成软件项目的分类。能够及时发现开源社区出现的新主题,并对软件项目进行自动分类,方便软件开发者依据软件主题搜索需要的开源软件项目,从而提高软件开发的效率,提高开源社区质量和保障。
0/0