基于聚类集成学习的软件缺陷预测方法

    公开(公告)号:CN118626384A

    公开(公告)日:2024-09-10

    申请号:CN202410817614.2

    申请日:2024-06-24

    摘要: 本发明公开了基于聚类集成学习的软件缺陷预测方法,涉及软件缺陷预测技术领域。本发明与之前的软件缺陷预测方法相比,解决了现有软件缺陷预测方法需要大量数据进行对比,耗费大量时间及运行成本;只通过单一的聚类方法从特定的角度分析和处理数据,无法全面捕捉数据的特征和模式的问题;结合卡方检验和稀疏主成分分析的特征选择策略来进行特征选择;首先用卡方检验筛选出最具有统计显著性的特征,再使用稀疏主成分分析对这些显著特征进行降维;还基于谱聚类、纽曼聚类、流体聚类和CNM聚类四种方法组成的聚类集成方法进行软件缺陷预测。在性能上取得了显著的改善;为未来工作提供了有益的指导,强调了聚类集成方法在无监督学习中的潜在优势。

    基于词频逆文档频率和最大曲率点的实体解析分块方法

    公开(公告)号:CN117371443A

    公开(公告)日:2024-01-09

    申请号:CN202311230477.4

    申请日:2023-09-20

    摘要: 本发明涉及基于词频逆文档频率和最大曲率点的实体解析分块方法,包括以下步骤:S1、提取记录中的字符串类型的属性,对于数据集中的每条元组,首先按照属性名提取出字符串类型的属性,然后进行分词,分词后的令牌去除停用词,以使得每条元祖均嵌入令牌,S2、计算词频文档,计算步骤S1中每条元组嵌入的令牌的词频数,移除掉总词频数为1的令牌,建立语料库,S3、筛选令牌,根据步骤S2中建立的语料库算出记录中每个令牌的词频逆文档频率值TF_IDF,S4、完成初步分块,将步骤S3中选出的令牌作为键对记录进行初步的索引分块;本发明具有保证块质量的同时使减少率大大提升的优点。

    基于区块链的食品安全上链数据可信性度量方法

    公开(公告)号:CN113591148A

    公开(公告)日:2021-11-02

    申请号:CN202110876616.5

    申请日:2021-07-31

    IPC分类号: G06F21/62 G06F21/64 G06F16/27

    摘要: 本发明涉及食品溯源技术领域,且公开了基于区块链的食品安全上链数据可信性度量方法,包括建立链上成员信用度量模型,链上成员信用度量模型由链上成员初始信用度、上链数据共识度和第三方质检机构根据企业信息综合评价得到;建立链上数据质量度量模型,链上数据质量度量模型由数据质量属性度量模型构成;建立上链数据可信性度量模型,上链数据可信性度量模型由链上成员信用度量模型和链上数据质量度量模型用证据理论构建组成。该基于区块链的食品安全上链数据可信性度量方法,可以构建基于区块链的、动态的、层次化的食品安全上链数据可信性模型,使用户直接了解到当前数据状态,为后续的数据应用和分析提供可信性参考。

    一种基于投影距离正则化低秩表示的图像聚类方法

    公开(公告)号:CN117095191A

    公开(公告)日:2023-11-21

    申请号:CN202311028885.1

    申请日:2023-08-15

    摘要: 本发明提出了一种基于投影距离正则化低秩表示的图像聚类方法,捕捉数据集中图像的局部特征建立低秩表示问题的数学模型,在数学模型中使用Schatten‑p范数代替核范数;采用广义Stiefel流形优化投影矩阵的约束得到优化问题,利用交替方向乘子法求解优化问题,获得低秩表示矩阵和投影矩阵;根据低秩表示矩阵的SVD分解得到的正交投影向量构建相似度矩阵;利用N‑cut聚类算法把相似度矩阵每一列进行聚类,实现对原始图像进行聚类。本发明通过低秩表示学习减少数据冗余信息的影响,在图像学习过程中,引入投影距离正则化以捕捉图像的全局和局部几何结构,能够学习到一个更鲁棒、更准确的特征,使其聚类性能有显著提高。

    语义增强的多模态情感分析方法、系统、电子设备及存储介质

    公开(公告)号:CN118153580A

    公开(公告)日:2024-06-07

    申请号:CN202410015531.1

    申请日:2024-01-05

    摘要: 本申请提供一种语义增强的多模态情感分析方法、系统、电子设备及存储介质,所述方法包括:将原始视频数据输入到特征提取模块,获得各个模态的特征向量;将各个模态的特征向量输入到语义增强模块,分别获得音频特征向量和视觉特征向量对应的文本特征向量,将对应的文本特征向量拼接到原文本特征向量上获得增强后的文本特征向量;将增强后的文本特征向量、音频特征向量和视觉特征向量输入到多模态感知模块,获取模态间高关联性的特征向量;在差异性约束条件下,获取不同模态之间的高差异性特征向量;将高关联性的特征向量和高差异性的特征向量拼接,获得融合特征向量;将融合特征向量输入到情感预测网络,输出情感预测结果。

    基于迁移学习的跨项目软件缺陷数量预测方法

    公开(公告)号:CN117056226A

    公开(公告)日:2023-11-14

    申请号:CN202311043463.1

    申请日:2023-08-18

    IPC分类号: G06F11/36 G06F8/41 G06N3/096

    摘要: 本发明公开了基于迁移学习的跨项目软件缺陷数量预测方法,包括步骤:S1、源代码解析和向量映射:通过对Java项目源码进行转换,得到由抽象语法树转化的数字向量;S2、神经网络模型构建与特征提取:将数字向量输入到神经网络模型中,并引入迁移学习算法来提取不同项目间可迁移的语义特征;S3、构造缺陷数量预测模型;S4、使用目标项目对跨项目缺陷数量预测模型进行评估,判断每个模块中存在的缺陷数量。本发明结合迁移学习和深度学习方法来进行跨项目缺陷数量预测,通过使用神经网络模型来提取语义特征,然后使用迁移学习方法匹配项目间相似度高的特征,并和度量元特征进行联合,提高了模型在跨项目缺陷数量预测方面的性能。

    基于区块链的食品安全上链数据可信性度量方法

    公开(公告)号:CN113591148B

    公开(公告)日:2023-09-01

    申请号:CN202110876616.5

    申请日:2021-07-31

    IPC分类号: G06F21/62 G06F21/64 G06F16/27

    摘要: 本发明涉及食品溯源技术领域,且公开了基于区块链的食品安全上链数据可信性度量方法,包括建立链上成员信用度量模型,链上成员信用度量模型由链上成员初始信用度、上链数据共识度和第三方质检机构根据企业信息综合评价得到;建立链上数据质量度量模型,链上数据质量度量模型由数据质量属性度量模型构成;建立上链数据可信性度量模型,上链数据可信性度量模型由链上成员信用度量模型和链上数据质量度量模型用证据理论构建组成。该基于区块链的食品安全上链数据可信性度量方法,可以构建基于区块链的、动态的、层次化的食品安全上链数据可信性模型,使用户直接了解到当前数据状态,为后续的数据应用和分析提供可信性参考。

    一种食品质量安全追踪溯源系统及算法

    公开(公告)号:CN116503077A

    公开(公告)日:2023-07-28

    申请号:CN202211450014.4

    申请日:2022-11-19

    摘要: 本发明公开了一种食品质量安全追踪溯源系统及算法,具体涉及区块链技术领域;本发明所提出的算法具体是指应用于食品质量安全追踪溯源系统中基于签名机制的PBFT改进算法,记作I‑PBFT算法,该算法是在现有PBFT算法的基础上进行改进创新,具体包括对现有PBFT算法的一致性协议进行了创新;引入了安全节点集合以及在视图切换协议中加入心跳机制;在次基础上,本发明将I‑PBFT算法应用于具体的系统设计上,提出一种基于I‑PBFT算法的食品质量安全追踪溯源系统,结合上述对I‑PBFT算法的优点分析,同时结合仿真实验表明,本发明所提出的食品质量安全追踪溯源系统算法可有效降低通信开销和共识时延。