问答社区中的热门问题的预测方法及系统

    公开(公告)号:CN111581382A

    公开(公告)日:2020-08-25

    申请号:CN202010357802.3

    申请日:2020-04-29

    发明人: 张莉 赵丽娴 蒋竞

    摘要: 本发明涉及一种问答社区中的热门问题的预测方法,属于热门内容预测领域,解决了现有技术中采用的相关信息少,对热门问题的识别率和识别精度低的问题。预测方法包括:从问答社区中获取多个样本问题数据,其中,多个样本问题数据包括:问题的用户属性数据、问题的文本属性数据、问题的元数据属性数据和问题的时间属性数据;将多个样本问题数据转换为输入矩阵;根据输入矩阵构建全卷积神经网络,并对全卷积神经网络进行训练以获得全卷积神经网络预测模型;以及利用全卷积神经网络预测模型对待识别问题进行预测,以确定待识别问题的类别,其中,待识别问题的类别包括热门问题和冷门问题。采用全面信息能够提高热门问题的识别率和识别精度。

    基于机器学习的移动互联网用户评论挖掘方法

    公开(公告)号:CN108520012A

    公开(公告)日:2018-09-11

    申请号:CN201810233877.3

    申请日:2018-03-21

    发明人: 张莉 黄新越 蒋竞

    IPC分类号: G06F17/30

    摘要: 本发明提出了一种基于机器学习的移动互联网用户评论挖掘方法,属于需求工程与数据挖掘领域。本发明包括:步骤一关注领域与标注数据的选择、步骤二问题种类的制定、步骤三对应用程序分析比较的思路与数据、步骤四对步骤二和三中的数据进行预处理、步骤五为应用程序类型设置属性、步骤六对每个问题种类建立一个二元分类器。本发明方法通过数据属性的添加丰富了分类器使用的特征,通过代价敏感元分类器一定程度上解决了存在的数据不平衡问题,通过支持向量机的参数合理配置优化了分类器的效果,提高了评论分类的准确性,能灵活满足使用者的个性化需要,数据挖掘效果优于当前最好的用户评论分类方法。

    基于特征模型的实时系统中早期决策的时间分析方法

    公开(公告)号:CN107943569A

    公开(公告)日:2018-04-20

    申请号:CN201711045165.0

    申请日:2017-10-31

    发明人: 张莉 许荣飞 蒋竞

    IPC分类号: G06F9/48

    CPC分类号: G06F9/4837 G06F9/4881

    摘要: 本发明提出一种基于特征模型的实时系统中早期决策的时间分析方法,属于实时系统与建模分析领域。本发明首先根据与时间相关的决策可变性定义面向时间分析的实时系统概念模型,结合特征模型来构建面向决策分析的实时系统性能模型;然后定义时间分析树,以及两种特征模型中的关系操作算子,构造实时系统性能模型与时间分析树之间的转换方法;最后定义该时间分析树上的可变性定制规则和时间计算规则用于不同决策上的时间性能分析。本发明以直观、简单、有效的方式,结合模型中的特征语义信息定量地分析设计决策上的时间性能,提高了实时系统中早期决策上分析的精度和效率,解决了现有的软件性能工程方法分析阶段较晚,性能模型难以构建的问题。

    开源社区中辅助工具停用的预测方法及装置

    公开(公告)号:CN112114795B

    公开(公告)日:2022-02-11

    申请号:CN202010989416.6

    申请日:2020-09-18

    IPC分类号: G06F8/33 G06F40/289

    摘要: 本发明涉及一种开源社区中辅助工具停用的预测方法及装置,属于计算机科学技术领域,解决了现有的预测方法中项目对辅助工具使用/停用定义较为模糊且获取的特征较少,造成无法准确合理的预测辅助工具停用的问题。方法包括:获取项目数据和项目使用辅助工具的数据,得到历史数据集;基于历史数据集提取项目使用辅助工具的有效特征,生成特征向量,并基于特征向量得到输入矩阵;基于输入矩阵及XGBoost算法分类器构建辅助工具停用预测模型PATPredict;利用辅助工具停用预测模型PATPredict对目标项目使用的目标辅助工具进行停用预测,得到停用预测结果,能够快速高效的得到预测结果,提高了预测结果的精确度。

    一种众包开发者推荐方法和装置
    5.
    发明公开

    公开(公告)号:CN112396092A

    公开(公告)日:2021-02-23

    申请号:CN202011156133.X

    申请日:2020-10-26

    发明人: 蒋竞 吴秋迪 张莉

    IPC分类号: G06K9/62 G06F40/279 G06Q40/04

    摘要: 本发明涉及一种众包开发者推荐方法和装置,属于计算机技术领域,解决了现有技术中的相关信息少,对开发人员预测的准确率低的问题。众包开发者推荐方法包括:从开源社区的众包平台中获取多个众包任务数据,其中,多个众包任务数据包括:任务特征数据、开发者特征数据、开发者在开源社区中的数据以及开发者与任务的历史关系数据;将多个众包任务数据转换为输入矩阵;根据输入矩阵和众包任务与开发者的标记构建LGBM模型,并对LGBM模型进行训练,以获得LGBM预测模型;以及利用LGBM预测模型对待推荐任务进行开发者预测,以确定待推荐的开发者列表。通过完整全面的众包任务数据提高了人员推荐的正确率。

    一种众包开发者推荐方法和装置

    公开(公告)号:CN112396092B

    公开(公告)日:2023-09-29

    申请号:CN202011156133.X

    申请日:2020-10-26

    发明人: 蒋竞 吴秋迪 张莉

    摘要: 本发明涉及一种众包开发者推荐方法和装置,属于计算机技术领域,解决了现有技术中的相关信息少,对开发人员预测的准确率低的问题。众包开发者推荐方法包括:从开源社区的众包平台中获取多个众包任务数据,其中,多个众包任务数据包括:任务特征数据、开发者特征数据、开发者在开源社区中的数据以及开发者与任务的历史关系数据;将多个众包任务数据转换为输入矩阵;根据输入矩阵和众包任务与开发者的标记构建LGBM模型,并对LGBM模型进行训练,以获得LGBM预测模型;以及利用LGBM预测模型对待推荐任务进行开发者预测,以确定待推荐的开发者列表。通过完整全面的众包任务数据提高了人员推荐的正确率。

    一种开源社区的拉取请求描述生成方法和装置

    公开(公告)号:CN115145550A

    公开(公告)日:2022-10-04

    申请号:CN202210917697.3

    申请日:2022-08-01

    发明人: 蒋竞 刘子豪 张莉

    摘要: 本发明涉及一种开源社区的拉取请求描述生成方法和装置,属于拉取请求技术领域,解决生成拉取请求描述时仅考虑新拉取请求自身的信息,对若干拉取请求的历史数据利用不够充分的问题。该方法包括:从开源社区获取多个拉取请求和相对应的描述;基于每个拉取请求生成代码语法改动树;基于代码语法改动树生成改动向量;基于多个改动向量计算拉取请求的相似程度;利用输入拉取请求和相似拉取请求获取描述生成模型;利用多个相似拉取请求的描述和输入拉取请求包含的文本信息,使用描述生成模型计算输入拉取请求的描述。改动向量有效地提取代码改动的语法结构信息,以利用与新拉取请求相似的拉取请求,自动化生成拉取请求描述。

    一种开源社区异常点赞用户的识别方法及系统

    公开(公告)号:CN110457630B

    公开(公告)日:2022-03-29

    申请号:CN201910694279.0

    申请日:2019-07-30

    发明人: 蒋竞 刘一帆 张莉

    摘要: 本发明涉及一种开源社区异常点赞用户的识别方法及系统,属于异常用户识别技术领域,解决了现有技术中对开源社区异常点赞用户识别率低的问题。该方法包括以下步骤:获取样本用户数据;根据样本用户数据构建决策树,训练得到决策树分类模型;利用决策树分类模型对待识别用户进行分类,确定用户类别;用户类别包括正常点赞用户和异常点赞用户。本发明根据用户属性和用户点赞项目属性,能够更精确的识别出异常点赞用户,以净化开源社区环境。

    一种预测开源社区贡献请求评审结果的方法

    公开(公告)号:CN109165163A

    公开(公告)日:2019-01-08

    申请号:CN201811014402.1

    申请日:2018-08-31

    IPC分类号: G06F11/36 G06Q10/06

    摘要: 本发明涉及一种预测开源社区贡献请求评审结果的方法,属于评审结果预测技术领域,解决了现有RFPredict预测方法过多利用在评审过程中产生的特征属性,造成评审结果不准确的问题。包括以下步骤:提取待训练贡献请求的特征,生成特征向量;采用XGBoost算法构建预测模型XGPredict;利用上述模型对待预测的贡献请求进行评审结果预测。通过本发明方法,在贡献者提交贡献请求之后就能快速预估出评审结果,一方面可以使贡献者能够及时对代码重新做出修改,另一方面又能辅助决策者进行决策,加快评审周期。另外,还能够随着时间推移自动更新预测模型,保证模型的准确性以及有效性,具有实践意义。

    一种问答社区的答案推荐方法和装置

    公开(公告)号:CN111368177B

    公开(公告)日:2023-10-24

    申请号:CN202010135679.0

    申请日:2020-03-02

    发明人: 张莉 王丽婷 蒋竞

    摘要: 本发明涉及一种问答社区的答案推荐方法和装置,属于软件技术领域,解决了现有技术中无法及时获得准确答案和用户体验差等的问题。该方法包括:获取采样周期内的多个待定问题;对多个待定问题的重复性进行批量检测;当待定问题与样本问题重复时,将与待定问题重复的样本问题的答案推荐给用户;当没有检测到待定问题与样本问题重复而检测到多个待定问题重复时,对多个待定问题根据重复性进行分类;以及将分类的重复待定问题中时间最早的待定问题作为标准样本问题存储在问答社区数据库中并将标准样本问题的答案推荐给提出重复待定问题的所有用户。因此,及时将答案推荐给用户,提升了问题推荐效率和准确性并提高了用户体验。