-
公开(公告)号:CN105389330B
公开(公告)日:2019-02-12
申请号:CN201510617004.9
申请日:2015-09-21
申请人: 中国人民解放军国防科学技术大学
IPC分类号: G06F16/958 , G06F16/93
摘要: 一种开源软件跨社区匹配关联方法,采用通用的Web爬虫技术从互联网的主要开源项目托管社区和知识分享社区中获取开源软件及在线文档信息数据,利用开源软件的项目名称及项目标签与在线文档信息的文档标题及文档标签进行关联匹配,为不同匹配类型设置不同的权重,实现在线文档与开源软件的跨社区关联关联,提高开发人员在使用开源软件查找相关信息时的效率。
-
公开(公告)号:CN107273295B
公开(公告)日:2020-03-20
申请号:CN201710484890.1
申请日:2017-06-23
申请人: 中国人民解放军国防科学技术大学
摘要: 本发明公开了一种基于本文混乱度的软件问题报告分类方法,该方法包括以下步骤:1)对GitHub平台进行数据采集,所采集的数据包括大众提交的问题报告以及该报告的相关信息;2)数据集标注,通过对问题报告的标签进行人工的抽样分析,从中选取出能够表示问题报告类型的标签,从而通过这些标签实现对数据集的标注;3)对数据集进行预处理,包括对文本信息进行预处理,去除不需要的信息,并通过文本信息数字化,将文本信息转化为可以进行计算处理的数字形式;4)模型构建,利用已有的机器学习方法,构建一个两层的自动化问题报告分类器。本发明提出的方法能够提升问题报告分类的自动化水平,降低人工成本,提高大众贡献汇聚效率。
-
公开(公告)号:CN105389327B
公开(公告)日:2019-07-16
申请号:CN201510617001.5
申请日:2015-09-21
申请人: 中国人民解放军国防科学技术大学
IPC分类号: G06F16/951 , G06F16/25 , G06F16/215
摘要: 一种开源软件标签层次自动化构建方法,包括利用已有的抽取工具将项目标签信息抽取出来,抽取得到的项目标签任意两两之间匹配,形成若干个无向标签对,然后统计出根据所有记录计算出的标签对信息计算出的标签对出现频次,并根据标签频次关系为标签对加上方向,形成 边;将有向边相互连接起来就可以形成若干个连通图而得到初步构建的标签层次;获取站点已有分类层次,进行边的比较,对已有分类层次进行优化。具有对开源社区中大规模开源资源进行层次化组织,提高开源软件定位准确性和效率的效果。
-
公开(公告)号:CN105389331A
公开(公告)日:2016-03-09
申请号:CN201510617005.3
申请日:2015-09-21
申请人: 中国人民解放军国防科学技术大学
CPC分类号: G06F17/30867 , G06F17/30887 , G06Q30/0201
摘要: 一种基于市场需求的开源软件分析方法,选取以针对计算机行业的招聘信息为主的招聘站点,爬取广告并抽取广告属性信息;爬取开源软件数据信息;对开源软件和广告信息进行匹配关联;根据用户选择,将反映市场需求的软件列表反馈给用户,同事为软件开发者提供其关心的开源软件就业发展情况。
-
公开(公告)号:CN105389328A
公开(公告)日:2016-03-09
申请号:CN201510617002.X
申请日:2015-09-21
申请人: 中国人民解放军国防科学技术大学
IPC分类号: G06F17/30
CPC分类号: G06F16/951
摘要: 一种面向大规模开源软件的搜索排序优化方法,用通用Web爬虫技术爬取开源软件属性、及帖子数据属性,建立开源软件与帖子的关联,计算关联度。根据开源软件关联到的帖子计算该软件的影响力。对用户请求的搜索结果,根据关联度和开源软件的影响力对搜索结果综合排序,即按照关联度*lg(影响力)得到的值由高到低排序,将排序后的搜索结果提供给用户。本申请能根据用户输入的关键字搜索返回相关开源软件,并将用户真正需要的开源软件排在前面。
-
公开(公告)号:CN105389328B
公开(公告)日:2019-07-16
申请号:CN201510617002.X
申请日:2015-09-21
申请人: 中国人民解放军国防科学技术大学
IPC分类号: G06F16/951
摘要: 一种面向大规模开源软件的搜索排序优化方法,用通用Web爬虫技术爬取开源软件属性、及帖子数据属性,建立开源软件与帖子的关联,计算关联度。根据开源软件关联到的帖子计算该软件的影响力。对用户请求的搜索结果,根据关联度和开源软件的影响力对搜索结果综合排序,即按照关联度*lg(影响力)得到的值由高到低排序,将排序后的搜索结果提供给用户。本申请能根据用户输入的关键字搜索返回相关开源软件,并将用户真正需要的开源软件排在前面。
-
公开(公告)号:CN105389330A
公开(公告)日:2016-03-09
申请号:CN201510617004.9
申请日:2015-09-21
申请人: 中国人民解放军国防科学技术大学
IPC分类号: G06F17/30
CPC分类号: G06F17/3089 , G06F17/30011
摘要: 一种开源软件跨社区匹配关联方法,采用通用的Web爬虫技术从互联网的主要开源项目托管社区和知识分享社区中获取开源软件及在线文档信息数据,利用开源软件的项目名称及项目标签与在线文档信息的文档标题及文档标签进行关联匹配,为不同匹配类型设置不同的权重,实现在线文档与开源软件的跨社区关联,提高开发人员在使用开源软件查找相关信息时的效率。
-
公开(公告)号:CN105389329A
公开(公告)日:2016-03-09
申请号:CN201510617003.4
申请日:2015-09-21
申请人: 中国人民解放军国防科学技术大学
IPC分类号: G06F17/30
CPC分类号: G06F17/30867
摘要: 一种能够基于群体评论对开发者正在开发的软件项目进行有效的组合软件推荐方法,包括获取开源数据,对所述项目和评论文档标签进行预处理;提取用户本地项目特征,利用评论文档标签、标题和项目名称、标签,对项目和评论文档进行匹配;计算本地项目与采集的开源项目的相似性和相关性;对相关性和相似性进行线性加权求和,为用户生成项目推荐列表。本发明可以与开发者的软件开发环境集成,提高开发者对互联网范围内相关软件的检索效率,并从推荐的软件项目获得技术支持或者实现软件重用。
-
公开(公告)号:CN105389331B
公开(公告)日:2019-02-12
申请号:CN201510617005.3
申请日:2015-09-21
申请人: 中国人民解放军国防科学技术大学
IPC分类号: G06F16/9535 , G06Q30/02
摘要: 一种基于市场需求的开源软件分析方法,选取以针对计算机行业的招聘信息为主的招聘站点,爬取广告并抽取广告属性信息;爬取开源软件数据信息;对开源软件和广告信息进行匹配关联;根据用户选择,将反映市场需求的软件列表反馈给用户,同时为软件开发者提供其关心的开源软件就业发展情况。
-
公开(公告)号:CN105389329B
公开(公告)日:2019-02-12
申请号:CN201510617003.4
申请日:2015-09-21
申请人: 中国人民解放军国防科学技术大学
IPC分类号: G06F16/9535 , G06F16/951
摘要: 一种能够基于群体评论对开发者正在开发的软件项目进行有效的组合软件推荐方法,包括获取开源数据,对所述项目和评论文档标签进行预处理;提取用户本地项目特征,利用评论文档标签、标题和项目名称、标签,对项目和评论文档进行匹配;计算本地项目与采集的开源项目的相似性和相关性;对相关性和相似性进行线性加权求和,为用户生成项目推荐列表。本发明可以与开发者的软件开发环境集成,提高开发者对互联网范围内相关软件的检索效率,并从推荐的软件项目获得技术支持或者实现软件重用。
-
-
-
-
-
-
-
-
-