用于企业合作的知识数据存储方法、装置

    公开(公告)号:CN111651465B

    公开(公告)日:2023-09-29

    申请号:CN202010380019.9

    申请日:2020-05-08

    IPC分类号: G06F16/23 G06F16/36

    摘要: 本发明公开了一种用于企业合作的知识数据存储方法、装置,所述方法包括:依据获取的知识数据,采用RDF和Owl建立知识数据库;在所述知识数据库之中,采用Neo4J作为知识数据库的存储引擎存储知识数据;对知识数据库进行数据更新和维护;所述知识数据库接收基于限定性语言模板的请求信息。采用上述技术方案,可以应对企业合作场景,实现面向企业合作相关的知识数据计算进而实现查询、更新或者维护,同时由于空间复杂度的降低,在知识数据计算过程中的资源消耗较小,可以在个人电脑上进行。

    一种基于语义相似度的Java应用程序接口使用模式推荐方法

    公开(公告)号:CN109670022B

    公开(公告)日:2023-09-29

    申请号:CN201811526803.5

    申请日:2018-12-13

    摘要: 本发明公开一种基于语义相似度的Java应用程序接口使用模式推荐方法,包括如下步骤:提取项目中的Java文件中的注释信息、应用程序接口调用序列和方法签名,构成元数据结构;对元数据结构使用层次聚类算法,提取应用程序接口使用模式;基于语义相似度,进行应用程序接口使用模式推荐。此种方法提出了通过语义相似度,推荐Java应用程序接口使用模式的方法,提高了Java应用程序接口使用模式的推荐准确率,减少了开发人员的编程时间,提高了开发人员的开发效率。

    一种WordNet到Neo4J的映射方法、语义检测方法及语义计算扩展接口生成方法

    公开(公告)号:CN110263178B

    公开(公告)日:2023-05-12

    申请号:CN201910477451.7

    申请日:2019-06-03

    摘要: 本发明公开了一种WordNet到Neo4J的映射方法、语义检测方法及语义计算扩展接口生成方法,包括:提取同义词集合有效信息,并将其映射到Neo4J中的同义词集结点上;采用广度优先算法遍历每个以特定关系相关连的两个同义词集结点,并生成相应的Neo4J同义词集结点之间的连接;遍历WordNet中的所有单词和每个单词对应的义元集合,并基于义元集合实现单词到同义词集的绑定形成单词结点。本发明采用基于WordNet语义关系网络实现了高效的语义计算,语义计算的实现上浮到了基于Cyper语言层,表达更加直观,使得语义计算可视化,并且映射到Neo4j的图结构,处理数据的速度更快;Neo4j的图结构的优化使得语义检测算法的实现过程中的查询从空间复杂度On^n降到了O1。

    基于特征分布分析的深度学习测试样本选择方法及系统

    公开(公告)号:CN115905860A

    公开(公告)日:2023-04-04

    申请号:CN202211344257.X

    申请日:2022-10-31

    摘要: 本发明公开了一种基于特征分布分析的深度学习测试样本选择方法及系统,方法包括:采用聚类方法对训练样本的特征分布进行划分,得到训练样本的特征分布集群;根据训练样本的特征分布集群,计算每个训练样本/测试样本分布在每个特征分布集群上的特征差异值;根据训练样本的输出向量计算训练样本的特征分散度;基于排序学习算法构建排序模型,并实现对测试样本的预测和排序;生成合成测试集,利用排序模型对合成测试集进行排序,并设置采样比,选择排序靠前的测试样本构成测试子集。本发明方法在有限资源下筛选出能够快速充分检测出DNN模型故障的测试输入,以缓解数据分布变化对DNN模型精度影响的同时,减少测试标记成本,提高DNN模型测试效率。

    一种基于编程现场上下文深度感知的代码行推荐方法

    公开(公告)号:CN109522011B

    公开(公告)日:2021-05-25

    申请号:CN201811206811.1

    申请日:2018-10-17

    IPC分类号: G06F8/33

    摘要: 本发明公开了一种基于编程现场上下文深度感知的代码行推荐方法,利用了深度学习技术在编程语言处理中的作用及其在上下文隐含模式感知中的优势。基于已有的海量源码数据,利用深度学习析取代码行的相关上下文因子,挖掘隐含上下文信息,为精准推荐提供基础。利用编程现场已有的源码数据和任务数据对当前代码行进行预测,并推荐最准确的、由高到低排好序的N个代码行。本方法不仅能够推荐准确度较高的代码行,还具有较好的自动性,不需要手动输入查询,实现自动检测已有的代码行上文。

    API指令检测方法、装置
    26.
    发明公开

    公开(公告)号:CN111651163A

    公开(公告)日:2020-09-11

    申请号:CN202010356444.4

    申请日:2020-04-29

    摘要: 本发明公开了一种API指令检测方法、装置,所述方法包括:对API文档中的语句进行划分,得到API指令语句和普通语句;将API指令语句分别和普通语句组成多个类平衡训练子集;其中类平衡训练子集中API指令语句所占比例至少达到预设的平衡数值;API指令检测模型基于API特征标准,以类平衡训练子集作为训练集进行训练;使用训练完成的API指令检测模型进行API指令检测。采用上述技术方案,可以有效、准确且高效率地从API文档中检测识别API指令。

    一种基于深度语义挖掘的代码段推荐方法

    公开(公告)号:CN108717423B

    公开(公告)日:2020-07-07

    申请号:CN201810371788.5

    申请日:2018-04-24

    摘要: 本发明公开了一种基于深度语义挖掘的代码段推荐方法,利用了深度学习技术在自然语言处理中的作用及其在自然语言语义挖掘中的优势,并且结合了有查询代码段推荐的特点。根据输入的自然语言搜索和代码段自身及其所带的注释,深度挖掘自然语言语义和代码段具体功能,生成句向量和段落向量,使得语义属性一致的代码段和自然语言查询因此被映射到相似的向量空间,为给定的查询推荐最匹配的、相似度由高到低排好序的N个代码段。本方法不仅提高了推荐的准确度,还能提高推荐的查全率,并对输入的自然语言查询查询具有较好的容错能力。

    一种考虑代码语句顺序信息的代码片段推荐方法

    公开(公告)号:CN109634594A

    公开(公告)日:2019-04-16

    申请号:CN201811306306.4

    申请日:2018-11-05

    IPC分类号: G06F8/33 G06F8/36

    摘要: 本发明公开了一种考虑代码语句顺序信息的代码片段推荐方法,包括:获取当前代码上下文,进行格式化、结构信息和声明的变量类型提取,并将清理后的代码片段转化为LC序列;计算代码数据库中代码片段和当前代码上下文的BWT相似度和变量类型相似度,获取若干与当前代码上下文相似度最高的代码片段作为候选集;根据候选集中代码片段与当前代码上下文的BWT相似性、变量相似性和结构相似性对候选代码片段进行重新排序,并向用户呈现重新排序的列表。与现有技术相比,本发明使用了代码语句之间的顺序信息,使得推荐的代码片段与查询之间的相似度更高,用户能够更好的使用推荐的代码片段。并且在排序过程中引入了结构信息,使其能够获得更好的排序的效果。

    基于缺陷分析的图像识别软件测试数据增强方法及装置

    公开(公告)号:CN113448843B

    公开(公告)日:2024-05-28

    申请号:CN202110670603.2

    申请日:2021-06-17

    摘要: 本发明公开了一种基于缺陷分析的图像识别软件测试数据增强方法及装置,步骤如下:收集待测图像识别软件用户反馈的自然语言文本形式的数据,以构造统一的用户反馈数据集;构建用户反馈分类模型,提取图像识别功能相关的缺陷报告;构建所述缺陷报告中的实体对;将描述相似缺陷问题的实体对进行分组,选取实体对,构造测试上下文集合;依据所述测试上下文集合,构造满足图像识别软件的通用和典型数据蜕变规则;依据所述数据蜕变规则,将原始测试数据进行数据蜕变,生成衍生测试数据。本发明基于数据蜕变技术实现测试数据的增强,挖掘与图像识别功能缺陷相关的用户反馈文本,利用自然语言处理和深度学习技术,提炼描述功能缺陷的关键信息。

    一种基于融合变异的图像对抗样本生成方法

    公开(公告)号:CN112561909B

    公开(公告)日:2024-05-28

    申请号:CN202011579491.1

    申请日:2020-12-28

    摘要: 本发明提出了一种基于融合变异的图像对抗样本生成方法。方法包括:分别建立原始图像与干扰图像的高斯金字塔,在高斯金字塔的运算过程中,用高斯金字塔的每一层图像减去其上一层图像上采样并高斯卷积之后的重构图像,得到每一层损失信息,建立拉普拉斯金字塔存储这些损失信息;提取生成的两个高斯金字塔顶层的图像,用像素选择函数对两个图像进行融合;对融合后的图像进行上采样操作,再加上相应层次的原始图片拉普拉斯金字塔中的损失信息,再次进行上采样操作,重复上述操作,最终得到一个与原始图像相同大小的变异图像,形成图像对抗样本。本发明能够在测试数据不足的情况下生成足够多且高质量的测试数据。