-
公开(公告)号:CN116796856A
公开(公告)日:2023-09-22
申请号:CN202310789592.9
申请日:2023-06-30
申请人: 北京航空航天大学
IPC分类号: G06N20/00 , G06F18/24 , G06F18/214
摘要: 本发明通过软件工程和人工智能领域的方法,实现了一种面向分类任务的机器学习模型选择方法,总体上包括样本标注优先级排序算法、样本筛选与标注、模型测试与排序三个部分;输入是一组候选模型和一个未标注的目标任务数据集,输出是这组模型中在这个数据集上表现最好的一个模型,通过五个步骤实现模型的对比测试与选择;本发明采用样本标注优先级评估算法,主要从样本分类置信度、样本标签误判程度两个方面评估样本标注优先级,以此筛选出小部分样本进行标注,降低了对比测试的标注成本;同时使用样本优先级评估算法针对现有数据集挑选少量样本对模型进行微调,有效地提高了模型的准确度。
-
公开(公告)号:CN112906293B
公开(公告)日:2023-05-02
申请号:CN202110115363.X
申请日:2021-01-28
申请人: 北京航空航天大学
IPC分类号: G06F30/27 , G06F18/241 , G06F18/40 , G06Q50/20
摘要: 本发明通过人工智能领域的方法,实现了一种基于复习机制的机器教学方法,包括一个引入复习机制的机器教学框架和应用于所述机器教学框架的学习者模型以及应用所述学习者模型设计的教学算法。机器教学框架在传统的学习者教学框架中引入复习机制,发挥了学习者学习时的主动性;学习者模型通过引入影响因素A(si)、B(si)和C(si),并设计学习者选择样例的策略,对新学习框架下“能够实施复习行为”的学习者进行了建模;教学算法基于贪婪算法,针对上述能够自主决策的学习者模型,提出了一套专门的教学算法。通过上述方案,实现使得学习者在学习同等数量的教学样例后,在回答同类问题时取得比传统机器教学方法更低的错误率的效果。
-
公开(公告)号:CN112765031B
公开(公告)日:2022-08-19
申请号:CN202110093372.3
申请日:2021-01-25
申请人: 北京航空航天大学
IPC分类号: G06F11/36
摘要: 本发明通过软件工程、信息安全和人工智能领域的方法,实现了一种群智化漏洞挖掘任务的分解方法。方法包含预处理、相关指标计算和聚类三个步骤。在提取源代码中所有函数的调用链之后,采用预处理算法对所述调用链进行处理;进而依次计算每个函数的复杂度指标、任意两个函数在功能上的相似度、任意两个函数在可能存在漏洞上的相似度三个指标;最后利用最少任务数量、最小相似度和最大工作量三个参数结合所述类的预估工作量和调用链之间的相似度形成类,并将每个类作为子任务进行输出。最终形成能够将任务分解为子任务间相关性较低、子任务内相关性较高的若干子任务,同时通过关键词提取,给出每个子任务的提示的任务分解方法。
-
公开(公告)号:CN108876031B
公开(公告)日:2022-06-28
申请号:CN201810598339.4
申请日:2018-06-12
申请人: 北京航空航天大学
摘要: 一种软件开发者贡献值预测方法,包括步骤一,构建开发者之间的社交关系所构成的有向图网络G(N,E),所述节点N是开源社区中的开发者,E是开发者之间的社交关系,步骤一包含两个步骤,步骤1.1,从问题追踪系统文本中挖掘构建开发者情感网络,得到由情感和实体组成的二元组(情感,实体),继而构成由表达着,情感,表达对象构成的三元组(表达者,情感,表达对象);步骤1.2,从问题追踪系统开发者反应行为中挖掘构建开发者社交网络,构成由表达者,反应,文本提出人构成的三元组(表达者,反应,文本提出人),步骤1.1和步骤1.2中的三元组即构成有向图网络G(N,E);步骤二,通过简化开发者社交网络计算开发者潜在贡献值。
-
公开(公告)号:CN114528221A
公开(公告)日:2022-05-24
申请号:CN202210173406.4
申请日:2022-02-24
申请人: 北京航空航天大学
摘要: 本发明公开了一种基于异质图神经网络的软件缺陷预测方法,属于软件缺陷测试领域:首先,针对已有的软件仓库和软件缺陷日志数据,通过相应的解析将它们转化为对应的代码图和缺陷链;并根据缺陷描述信息的内容,通过带状态机的前缀树将代码图中的节点与缺陷图中的节点进行跨域关联;分别对代码节点和缺陷节点生成表示向量后,送入到异质图神经网络中进行多层次的注意力聚合,得到内容和语义路径的信息传递,并得到连接的代码节点和缺陷节点;使用知识图谱表示学习方法对连接节点进行解码,将解码得分归一化后即得到代码节点是否存在缺陷;本发明从新的方式开展软件缺陷预测,提高了软件缺陷预测工具的精确性。
-
公开(公告)号:CN112035347B
公开(公告)日:2022-03-01
申请号:CN202010867776.9
申请日:2020-08-26
申请人: 北京航空航天大学
摘要: 本发明实现了一种源代码的自动异常处理方法,通过检测定位异常代码和生成处理对应异常的代码两个步骤,以LSTM神经网络方法作为基础方法,对未经过异常处理的代码进行代码异常的检测与定位,并生成相应的catch语句。本发明技术方案能够突破异常处理原则违反检测技术的应用范围限制,自动地检测待开发代码中存在的异常,同时解决异常处理代码推荐技术中存在的代码不完整性导致仍依赖开发者等现有自动化手段无法解决的问题。
-
公开(公告)号:CN110390050B
公开(公告)日:2021-12-07
申请号:CN201910620493.1
申请日:2019-07-10
申请人: 北京航空航天大学
IPC分类号: G06F16/9535 , G06F16/951
摘要: 本发明提出一种基于深度语义理解的软件开发问答信息自动获取方法,包括以下步骤:步骤1,使用文本搜索引擎从多个开发者问答论坛网站基于帖子的七个特征搜索n条和该问题相关的帖子;步骤2,对于问题Q以及n条与之相关的帖子,构造n条“ ”的数据对,输入一个有用性推理网络KnowNet进行推理预测,此网络输出每个帖子的有用性等级和指示该等级的概率值;步骤3,基于有用性推理网络KnowNet的推理结果,对相同有用性等级内每条帖子按照概率值进行排序,然后将各个等级由高到低排列在一起,最后选择有用性最高的K条帖子返回给提问者。
-
公开(公告)号:CN112765031A
公开(公告)日:2021-05-07
申请号:CN202110093372.3
申请日:2021-01-25
申请人: 北京航空航天大学
IPC分类号: G06F11/36
摘要: 本发明通过软件工程、信息安全和人工智能领域的方法,实现了一种群智化漏洞挖掘任务的分解方法。方法包含预处理、相关指标计算和聚类三个步骤。在提取源代码中所有函数的调用链之后,采用预处理算法对所述调用链进行处理;进而依次计算每个函数的复杂度指标、任意两个函数在功能上的相似度、任意两个函数在可能存在漏洞上的相似度三个指标;最后利用最少任务数量、最小相似度和最大工作量三个参数结合所述类的预估工作量和调用链之间的相似度形成类,并将每个类作为子任务进行输出。最终形成能够将任务分解为子任务间相关性较低、子任务内相关性较高的若干子任务,同时通过关键词提取,给出每个子任务的提示的任务分解方法。
-
公开(公告)号:CN107679766B
公开(公告)日:2020-12-25
申请号:CN201711007932.9
申请日:2017-10-24
申请人: 北京航空航天大学
IPC分类号: G06Q10/06
摘要: 本发明公开了一种群智任务动态冗余调度方法及装置,所述方法包括:接收用户输入的总预算值和待完成的任务;为各个任务分配初始冗余度并发布至群智平台,其中,所述冗余度用于实现对所述任务的标注,得到标注结果;从群智平台收集标注结果,并基于所述总预算值计算剩余预算值,判断所述剩余预算值是否大于零;当所述剩余预算值大于零时,对所述各个任务进行质量评估,并基于质量评估结果选择出质量小于预设阈值的任务;为所选择出的任务分配预设数量的冗余度并发布至群智平台;当所述剩余预算值等于零时,采用汇聚算法对各个任务的各个标注结果进行汇聚,得到各个任务的汇聚结果并输出给所述用户。
-
公开(公告)号:CN106446039B
公开(公告)日:2020-07-21
申请号:CN201610786249.9
申请日:2016-08-30
申请人: 北京航空航天大学
IPC分类号: G06F16/2453 , G06F16/2455
摘要: 本发明提供一种聚合式大数据查询方法及装置,所述方法包括:获取聚合式大数据查询请求;根据所述聚合式大数据查询请求,从n个数据处理节点中获取n个查询任务;将每个所述查询任务分解为m个数据组;获取每个数据组的大小,并确定所述n个查询任务中具有相同键值的数据组中数据量最大的数据组;确定所述数据量最大的数据组所对应的查询任务的数据处理节点为查询任务执行节点;通过所述查询任务执行节点执行聚合式大数据查询任务。本发明提供的聚合式大数据查询方法及装置,通过确定所述数据量最大的数据组所对应的查询任务的数据处理节点为查询任务执行节点,可以减小聚合式大数据查询过程中数据传输的网络开销。
-
-
-
-
-
-
-
-
-