一种基于对比约束正则化的单细胞半监督聚类模型

    公开(公告)号:CN118471343A

    公开(公告)日:2024-08-09

    申请号:CN202410597630.5

    申请日:2024-05-14

    摘要: 本发明公开了一种基于对比约束正则化的单细胞半监督聚类模型scCCR。本发明设计了对比约束正则化模块,促使参考数据中相同类型细胞彼此靠近,不同类型细胞相互分离,以提高细胞聚类的准确性。此外,为了更好地增加细胞间的区分度,在深度生成软聚类的基础上引入深度散度聚类,构建深度双聚类模块,使目标数据在特征空间中进一步簇内紧凑、簇间分离。在模拟数据集、单个数据集及跨数据集上分别进行实验以验证scCCR的细胞聚类性能。实验结果表明,本发明scCCR在细胞聚类性能上表现优秀,有助于推断细胞组织内部的复杂细胞组成和功能特征。

    一种基于对称不确定度的交互特征选择方法

    公开(公告)号:CN118228034A

    公开(公告)日:2024-06-21

    申请号:CN202410530385.6

    申请日:2024-04-29

    摘要: 本发明公开了一种基于对称不确定度的交互特征选择方法SUIFS,涉及数据挖掘领域。本发明基于对称不确定度衡量特征与类标签之间的相关性,基于标准化条件互信息衡量特征与特征之间的冗余度,基于多元互信息衡量候选特征与已选特征子集之间的交互作用。SUIFS从相关性、冗余度以及交互作用三个方面共同衡量候选特征,能够有效地选择特征子集,从而提升分类和聚类性能。SUIFS应用于基因表达数据,与现有的六种特征选择方法在八个公共基准数据集上进行了比较。实验结果表明,SUIFS能够有效提高特征子集的分类和聚类性能。

    一种基于多目标优化的协同粒子群SNP相互作用检测方法

    公开(公告)号:CN117316274A

    公开(公告)日:2023-12-29

    申请号:CN202311548610.0

    申请日:2023-11-21

    IPC分类号: G16B20/20 G16B40/00 G06N3/006

    摘要: 本发明公开了一种基于多目标优化的协同粒子群SNP相互作用检测方法。首先将原始种群,划分为多个子种群,每个子种群只考虑一个优化目标独立求解,接着使用改进的粒子群算法的更新公式,联合使用多个最佳非支配解(领导者)共同指导算法的搜索方向,保持种群多样性,然后使用滑动步长局部搜索技术减少方法的迭代次数,最后使用帕累托策略优化外部学习库的更新来提高解决方案的质量,减少解的假阳性,同时实现多个子种群协同检测SNP相互作用,有效地帮助方法定位帕累托前沿的不同部分,避免忽略目标,得到与疾病表型最相关的SNP相互作用。本发明利用协同进化思想检测SNP相互作用,并充分考虑多个子种群之间的信息交互,也采用多个目标函数解决了单一目标函数对疾病模型具有偏好性的问题,进而发现与复杂疾病相关的SNP相互作用,对揭示疾病的发病机制和发展趋势具有重要意义。

    一种SNP-SNP相互作用检测方法、系统、设备及介质

    公开(公告)号:CN116631505A

    公开(公告)日:2023-08-22

    申请号:CN202310627843.3

    申请日:2023-05-29

    IPC分类号: G16B20/20 G16B40/00

    摘要: 本申请实施例提供了一种SNP‑SNP相互作用检测方法、系统、设备及介质,涉及粒子群优化技术领域,用以解决现有的SNP‑SNP相互作用检测存在时间复杂度高、优化效率低的技术问题。包括:将互信息作为目标函数,并在所有粒子的分量中分别存放一个SNP;所述互信息用于表征SNP之间相互作用与疾病表型的关联性;按照降序排列将所有粒子自上而下依次填入到若干个子种群中;其中,每个子种群存放的粒子数目是一致的;对所述若干个子种群进行全局和局部搜索,以完成算法迭代;算法迭代终止后,获取所述目标函数值最高的粒子的位置,该粒子对应的SNP‑SNP间的相互作用与疾病表型的关联最强。

    一种基于社区结构增强和多目标粒子群的社区发现方法

    公开(公告)号:CN118469736A

    公开(公告)日:2024-08-09

    申请号:CN202410666076.1

    申请日:2024-05-28

    IPC分类号: G06Q50/00 G06N3/006

    摘要: 本发明公开了一种基于社区结构增强和多目标粒子群的社区发现方法,包括如下步骤,利用模糊邻域和k近邻计算节点的局部密度,结合相对距离计算节点的中心性值得分,以得到准确的中心节点集合;设计综合节点直接和间接作用的链路预测指标,通过基于中心节点的链路预测,使社区结构得到增强;为进一步优化基于中心节点扩展得到的初步社区划分,设计多目标粒子群优化策略,通过最小化两个改进的适应度函数,优化社区的内外部链接和节点之间的相似性,以解决初步划分中社团规模过于零散和散点归属不清晰的问题。本发明所公开的方法在社区发现性能上表现优秀,当社区结构模糊时,能够有效增强社区结构。

    一种基于约束域自适应网络的单细胞类型注释模型

    公开(公告)号:CN118314967A

    公开(公告)日:2024-07-09

    申请号:CN202410451859.8

    申请日:2024-04-16

    摘要: 本发明公开了一种基于约束域自适应网络的单细胞类型注释模型scCDAN。本发明利用域对齐模块,通过对抗学习策略实现源域与目标域数据分布对齐,以减少域间差异性。为更好地对细胞类型进行细粒度区分,设计类别边界约束模块,通过三元损失及中心损失来约束特征空间中同类型细胞以及不同类型细胞之间的位置关系,增加细胞之间的判别性。在模拟、跨平台、跨物种数据集上分别进行实验以验证scCDAN模型的有效性。实验结果表明,本发明scCDAN模型在细胞类型注释和批次校正方面性能良好,有利于帮助研究人员深入了解细胞生物学和疾病的发展过程。

    一种基于全局-局部图Transformer的多组学数据分类方法

    公开(公告)号:CN118228115A

    公开(公告)日:2024-06-21

    申请号:CN202410530391.1

    申请日:2024-04-29

    摘要: 本发明属于智能计算与数据挖掘领域,公开了一种基于全局‑局部图Transformer的多组学数据分类方法。首先,针对每种组学数据,通过全局‑局部图Transformer,结合图卷积层与多头自注意力层捕捉图的拓扑结构和语义信息,以捕获不同组学数据的全局‑局部特征表示;然后采用对比学习策略,学习样本之间的相似性和差异性,以从不同组学数据的异质性信息中挖掘更具有鉴别性和鲁棒性的图表示,深入理解复杂疾病患者之间的相互关系;最后通过深度融合网络实现多组学数据分类。本发明方法充分捕获了特征层面与组学层面的潜在信息,分类性能良好,对提高患者临床诊断结果的准确性以及推动精准医疗具有重要意义。

    一种基于最大相关最小冗余的交互特征选择方法

    公开(公告)号:CN117668509A

    公开(公告)日:2024-03-08

    申请号:CN202410026114.7

    申请日:2024-01-09

    摘要: 本发明公开了一种基于最大相关最小冗余的交互特征选择方法IFSMRMR,涉及数据挖掘领域。本发明基于归一化互信息衡量特征与类标签之间的相关性,基于条件互信息衡量特征与特征之间的冗余度,基于Copula熵衡量候选特征与已选特征子集之间的交互作用。该方法从三方面衡量候选特征,有效地选择特征子集,提升分类、聚类性能。该方法应用于基因微阵列数据,在八个公共基准数据集上与现有的六种特征选择方法进行了比较,实验结果表明,该方法选择出的特征子集具有更好的分类性能和聚类性能,对后续疾病研究具有重要意义。