基于变分编码的药物靶标结合性预测方法

    公开(公告)号:CN119580827A

    公开(公告)日:2025-03-07

    申请号:CN202510139658.9

    申请日:2025-02-08

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于变分编码的药物靶标结合性预测方法,属于生物信息学领域。本发明通过双阶段耦合的端到端的神经网络,实现对药物和靶标特征的高效提取、药物和靶标特征的潜在特征空间构建以及其相互作用关系的预测。该模型主要由两个阶段构成,在第一阶段通过变分压缩和提取特征,获得药物和靶标特征的潜在表示,在第二阶段通过上下采样综合的深度神经网络重构药物靶标作用矩阵。通过该架构,能够有效整合药物的化学特征与靶标的生物学特征,提升互动关系预测的准确性。本发明同时为生物学大数据的深入分析提供了一种新颖而高效的解决方案。

    模型构建方法、生物学年龄预测方法及装置、存储介质

    公开(公告)号:CN119580819A

    公开(公告)日:2025-03-07

    申请号:CN202411573296.6

    申请日:2024-11-05

    Abstract: 一种模型构建方法、生物学年龄预测方法及装置、存储介质,模型构建方法包括:生成第一数据集,第一数据集包括多个基因对应的基因表达水平以及甲基化水平数据,从第一数据集中选取多个候选基因,每个候选基因对应的基因表达水平与甲基化水平之间呈显著负相关;生成训练数据集和验证数据集,训练数据集包括多个第一基因的甲基化水平数据,验证数据集包括多个第二基因的甲基化水平数据;对候选基因、第一基因和第二基因取交集,得到交集基因;使用训练数据集和验证数据集中,多个交集基因对应的甲基化水平数据作为输入特征构建模型。本公开通过选择具有生物学意义的基因作为模型的输入特征,为模型增加遗传学和生物学基础,增强了模型的鲁棒性。

    一种与子宫内膜容受性相关的miRNA标志物及其应用

    公开(公告)号:CN119570944A

    公开(公告)日:2025-03-07

    申请号:CN202411790450.5

    申请日:2024-12-06

    Abstract: 本发明公开了一种与子宫内膜容受性相关的miRNA标志物及其应用。所述miRNA标志物包括:hsa‑miR‑199b‑5p、hsa‑miR‑33a‑3p、hsa‑miR‑4659a‑3p、hsa‑miR‑7702、hsa‑miR‑545‑5p、hsa‑miR‑133a‑5p和hsa‑miR‑150‑5p等。本发明通过对胚胎植入成功患者的子宫内膜不同容受期的血浆miRNA进行相关性分析和筛选,得到最优特征组合,利用机器学习方法建立预测模型,能够基于母体血清准确预测样本子宫内膜容受性不同时期的概率,解决了现有技术在进行预测胚胎能否成功着床时,样本提取过程复杂、侵入且有创的问题。

    宫颈癌微生物标志物及其应用
    7.
    发明公开

    公开(公告)号:CN119570933A

    公开(公告)日:2025-03-07

    申请号:CN202411746926.5

    申请日:2024-12-02

    Abstract: 本发明提供了多种宫颈癌微生物标志物及其应用,所述微生物标志物包括不解糖卟啉单胞菌(Porphyromonas asaccharolytica)和卷曲乳杆菌(Lactobacillus crispatus)、肺炎克雷伯菌(Klebsiella pneumoniae)和溶血孪生球菌(Gemella haemolysans)等11个菌。本发明根据训练的随机森林模型获得输出风险值的阈值,然后只需要获取已筛选出的11个生殖道微生物标志物的相对丰度,输入已建立的随机森林模型,即可得到宫颈病变样本为高危病变的概率值。本发明基于16S测序构建机器学习模型,可以及时识别宫颈癌的高危风险,用于宫颈癌患者的辅助诊断,有利于宫颈癌的早发现、早预防和早治疗,提高宫颈癌筛查的可及性。

    一种长尾数据分布下生成式基因大模型的单细胞注释方法

    公开(公告)号:CN119560033A

    公开(公告)日:2025-03-04

    申请号:CN202411711661.5

    申请日:2024-11-27

    Abstract: 本申请公开了一种长尾数据分布下生成式基因大模型的单细胞注释方法,该方法通过获取第一单细胞数据集和第二单细胞数据集;构建目标损失函数,目标函数用于平衡不同单细胞类型的表达量差异;基于第一单细胞数据集,对构建好的单细胞注释网络模型进行预训练,得到预训练好的单细胞注释网络模型;基于第二单细胞数据集和目标损失函数,对预训练好的单细胞注释网络模型进行微调,得到目标单细胞注释网络模型;采用目标单细胞注释网络模型对待注释的单细胞进行注释,得到注释好的单细胞。本申请能够有效解决数据集长尾分布问题,从而提高细胞注释的准确性和泛化能力。

    一种基于DNA甲基化特征的循环肿瘤DNA预测方法

    公开(公告)号:CN119560024A

    公开(公告)日:2025-03-04

    申请号:CN202311535288.8

    申请日:2023-11-17

    Applicant: 刘俊锋

    Inventor: 刘俊锋

    Abstract: 本申请属于生物信息学技术领域,具体涉及一种基于DNA甲基化特征从细胞游离DNA(cell free DNA,cfDNA)中预测循环肿瘤DNA(circulating tumor DNA,ctDNA)的方法,包括:在健康cfDNA样本、慢性炎症cfDNA样本和肿瘤组织样本中,选取DNA甲基化水平在同一类型样本间稳定而不同类型样本间存在显著差异的CpG位点;针对选取的CpG位点,基于参考数据集(健康cfDNA样本、慢性炎症cfDNA样本和肿瘤组织样本)和检测cfDNA样本构建统计模型,并采用最大期望(Expectation‑Maximization algorithm,EM)算法估计选取的CpG位点在不同类型样本中的甲基化水平以及检测cfDNA样本中ctDNA的占比;基于EM算法的估计结果,采用似然比检验(Likelihood Ratio Test,LRT)判断检测的cfDNA样本的样本类型,即属于健康样本、慢性炎症样本还是肿瘤样本;依据似然比检验结果,基于估计的CpG位点的甲基化水平和ctDNA的占比预测检测cfDNA样本中ctDNA片段。本申请能够对健康cfDNA样本、慢性炎症cfDNA样本和肿瘤cfDNA样本进行判别,并预测cfDNA样本中的ctDNA片段,进而富集ctDNA信号,有助于提高肿瘤早筛的灵敏度。

    细胞区域确定方法及装置、电子设备及存储介质

    公开(公告)号:CN119560022A

    公开(公告)日:2025-03-04

    申请号:CN202311069902.6

    申请日:2023-08-23

    Abstract: 本申请实施例提供了一种细胞区域确定方法及装置、电子设备及存储介质,属于细胞分割技术领域。细胞区域确定方法包括:从目标切片的空间转录数据中获取基因表达信息;其中,基因表达信息包括空间测序位点的位置信息以及对应的原始基因表达量;基于原始基因表达量将空间测序位点划分为细胞区域位点和非细胞区域位点;根据原始基因表达量以及位置信息在空间测序位点中确定第一种子位点;其中,第一种子位点为基于原始基因表达量与位置信息对多个空间测序位点进行聚类确定的聚类中心;根据第一种子位点确定目标种子位点,根据目标种子位点的位置信息以及细胞区域位点的位置信息确定目标切片的细胞区域。本申请实施例能够提高确定细胞区域的准确性。

Patent Agency Ranking