-
公开(公告)号:CN119580852A
公开(公告)日:2025-03-07
申请号:CN202411653970.1
申请日:2024-11-19
Applicant: 中国热带农业科学院环境与植物保护研究所
Abstract: 本发明公开了一种宏基因组数据集的生物地球化学元素循环分析方法及系统,包括:获取原始实验数据,基于原始实验数据获得注释文件、样本分组文件与非冗余基因组概况文件;对注释文件、样本分组文件与非冗余基因组概况文件进行预处理,获得样本数据集;构建化学元素循环分析模型,基于样本数据集与化学元素循环分析模型获得化学元素的剖面文件;将化学元素的剖面文件按照所对应的实验处理条件进行分类整理,对每个分类进行统计分析后进行可视化处理,并存储统计分析结果与可视化处理结果。当用户需要对庞大的宏基因组数据集进行分析时,使用户能够全面、快速、灵活地获取到直观的微生物的相关信息。
-
公开(公告)号:CN119580840A
公开(公告)日:2025-03-07
申请号:CN202410442997.X
申请日:2024-04-12
Applicant: 上海交通大学医学院附属上海儿童医学中心
IPC: G16B30/00 , G16B25/20 , G16B40/00 , G16B50/00 , G16H50/50 , C12Q1/6883 , C12Q1/689 , C12Q1/6869 , C12R1/01
Abstract: 本发明属于生物医药技术领域,本发明创新性地在患者队列中运用肠道菌群宏基因组学和肠菌来源血浆外泌体miRNA测序筛选出一系列差异miRNA和肠道菌种,并采用LASSO回归和逐步向后回归进行变量筛选,最终筛选得到两种miRNA包括miR_140_3p,miR_10a_5p和两种肠道菌种包括Anaeritruncus_sp_G3_2012,Bifidobacterium_longum作为标志物组合,同时构建了诊断模型,对识别心室重构具有高敏感性和特异性,能够提高心力衰竭早期识别的效率,更好地尽早地发现、识别、干预心室重构,预防及延缓心衰的发生,并且可应用于儿童群体,能够实现全生命周期筛查和监护,有望运用于临床检验,具有临床转化价值。
-
公开(公告)号:CN119580838A
公开(公告)日:2025-03-07
申请号:CN202411467503.X
申请日:2024-10-21
Applicant: 中国人民解放军陆军军医大学
IPC: G16B25/10 , G16B40/00 , G16B40/30 , G16B20/50 , G16B25/20 , G16H50/70 , G16H50/30 , G06F18/15 , G06F18/213 , G06F18/2135 , G06F18/23 , G06F18/2431 , G06F18/27 , G06F18/21
Abstract: 本发明涉及生物医学技术领域,具体公开了一种基于程序性细胞死亡特征基因的头颈部肿瘤预后和治疗反应预测模型的构建方法和应用。本发明利用头颈部肿瘤相关的scRNA‑seq数据集数据,基于目前已知的细胞死亡模式相关的基因,通过差异表达分析,获得在头颈部肿瘤中的细胞死亡模式相关的差异表达基因;在此基础上筛选出与头颈部肿瘤预后显著相关的表征头颈部肿瘤的程序性细胞死亡的特征基因;由此构建了头颈部肿瘤相关风险评分CDRscore模型;进一步通过独立验证集证实CDRscore模型的有效性,并使用喉鳞癌组织的空间转录组测序验证CDRscore模型中10个基因的分布。因此CDRscore可以作为预测术后预后和免疫治疗反应的新指标,这将协助结人头颈部肿瘤的临床治疗决策。
-
公开(公告)号:CN119580827A
公开(公告)日:2025-03-07
申请号:CN202510139658.9
申请日:2025-02-08
Applicant: 浙江大学
Abstract: 本发明公开了一种基于变分编码的药物靶标结合性预测方法,属于生物信息学领域。本发明通过双阶段耦合的端到端的神经网络,实现对药物和靶标特征的高效提取、药物和靶标特征的潜在特征空间构建以及其相互作用关系的预测。该模型主要由两个阶段构成,在第一阶段通过变分压缩和提取特征,获得药物和靶标特征的潜在表示,在第二阶段通过上下采样综合的深度神经网络重构药物靶标作用矩阵。通过该架构,能够有效整合药物的化学特征与靶标的生物学特征,提升互动关系预测的准确性。本发明同时为生物学大数据的深入分析提供了一种新颖而高效的解决方案。
-
公开(公告)号:CN119580819A
公开(公告)日:2025-03-07
申请号:CN202411573296.6
申请日:2024-11-05
Applicant: 中山大学肿瘤防治中心 , 香港中文大学
Abstract: 一种模型构建方法、生物学年龄预测方法及装置、存储介质,模型构建方法包括:生成第一数据集,第一数据集包括多个基因对应的基因表达水平以及甲基化水平数据,从第一数据集中选取多个候选基因,每个候选基因对应的基因表达水平与甲基化水平之间呈显著负相关;生成训练数据集和验证数据集,训练数据集包括多个第一基因的甲基化水平数据,验证数据集包括多个第二基因的甲基化水平数据;对候选基因、第一基因和第二基因取交集,得到交集基因;使用训练数据集和验证数据集中,多个交集基因对应的甲基化水平数据作为输入特征构建模型。本公开通过选择具有生物学意义的基因作为模型的输入特征,为模型增加遗传学和生物学基础,增强了模型的鲁棒性。
-
公开(公告)号:CN119570944A
公开(公告)日:2025-03-07
申请号:CN202411790450.5
申请日:2024-12-06
Applicant: 苏州贝康医疗器械有限公司
IPC: C12Q1/6888 , C12N15/11 , G16B40/00
Abstract: 本发明公开了一种与子宫内膜容受性相关的miRNA标志物及其应用。所述miRNA标志物包括:hsa‑miR‑199b‑5p、hsa‑miR‑33a‑3p、hsa‑miR‑4659a‑3p、hsa‑miR‑7702、hsa‑miR‑545‑5p、hsa‑miR‑133a‑5p和hsa‑miR‑150‑5p等。本发明通过对胚胎植入成功患者的子宫内膜不同容受期的血浆miRNA进行相关性分析和筛选,得到最优特征组合,利用机器学习方法建立预测模型,能够基于母体血清准确预测样本子宫内膜容受性不同时期的概率,解决了现有技术在进行预测胚胎能否成功着床时,样本提取过程复杂、侵入且有创的问题。
-
公开(公告)号:CN119570933A
公开(公告)日:2025-03-07
申请号:CN202411746926.5
申请日:2024-12-02
Applicant: 申友基因组研究院(南京)有限公司
IPC: C12Q1/6886 , G16H50/30 , G16H50/70 , G16B40/00 , C12Q1/689 , C12Q1/6869 , C12R1/225 , C12R1/22 , C12R1/35
Abstract: 本发明提供了多种宫颈癌微生物标志物及其应用,所述微生物标志物包括不解糖卟啉单胞菌(Porphyromonas asaccharolytica)和卷曲乳杆菌(Lactobacillus crispatus)、肺炎克雷伯菌(Klebsiella pneumoniae)和溶血孪生球菌(Gemella haemolysans)等11个菌。本发明根据训练的随机森林模型获得输出风险值的阈值,然后只需要获取已筛选出的11个生殖道微生物标志物的相对丰度,输入已建立的随机森林模型,即可得到宫颈病变样本为高危病变的概率值。本发明基于16S测序构建机器学习模型,可以及时识别宫颈癌的高危风险,用于宫颈癌患者的辅助诊断,有利于宫颈癌的早发现、早预防和早治疗,提高宫颈癌筛查的可及性。
-
公开(公告)号:CN119560033A
公开(公告)日:2025-03-04
申请号:CN202411711661.5
申请日:2024-11-27
Applicant: 华智生物技术有限公司
IPC: G16B50/10 , G16B40/00 , G16B25/00 , G06F18/241 , G06N3/0455 , G06N3/084
Abstract: 本申请公开了一种长尾数据分布下生成式基因大模型的单细胞注释方法,该方法通过获取第一单细胞数据集和第二单细胞数据集;构建目标损失函数,目标函数用于平衡不同单细胞类型的表达量差异;基于第一单细胞数据集,对构建好的单细胞注释网络模型进行预训练,得到预训练好的单细胞注释网络模型;基于第二单细胞数据集和目标损失函数,对预训练好的单细胞注释网络模型进行微调,得到目标单细胞注释网络模型;采用目标单细胞注释网络模型对待注释的单细胞进行注释,得到注释好的单细胞。本申请能够有效解决数据集长尾分布问题,从而提高细胞注释的准确性和泛化能力。
-
公开(公告)号:CN119560024A
公开(公告)日:2025-03-04
申请号:CN202311535288.8
申请日:2023-11-17
Applicant: 刘俊锋
Inventor: 刘俊锋
IPC: G16B40/00 , C12Q1/6886
Abstract: 本申请属于生物信息学技术领域,具体涉及一种基于DNA甲基化特征从细胞游离DNA(cell free DNA,cfDNA)中预测循环肿瘤DNA(circulating tumor DNA,ctDNA)的方法,包括:在健康cfDNA样本、慢性炎症cfDNA样本和肿瘤组织样本中,选取DNA甲基化水平在同一类型样本间稳定而不同类型样本间存在显著差异的CpG位点;针对选取的CpG位点,基于参考数据集(健康cfDNA样本、慢性炎症cfDNA样本和肿瘤组织样本)和检测cfDNA样本构建统计模型,并采用最大期望(Expectation‑Maximization algorithm,EM)算法估计选取的CpG位点在不同类型样本中的甲基化水平以及检测cfDNA样本中ctDNA的占比;基于EM算法的估计结果,采用似然比检验(Likelihood Ratio Test,LRT)判断检测的cfDNA样本的样本类型,即属于健康样本、慢性炎症样本还是肿瘤样本;依据似然比检验结果,基于估计的CpG位点的甲基化水平和ctDNA的占比预测检测cfDNA样本中ctDNA片段。本申请能够对健康cfDNA样本、慢性炎症cfDNA样本和肿瘤cfDNA样本进行判别,并预测cfDNA样本中的ctDNA片段,进而富集ctDNA信号,有助于提高肿瘤早筛的灵敏度。
-
公开(公告)号:CN119560022A
公开(公告)日:2025-03-04
申请号:CN202311069902.6
申请日:2023-08-23
Applicant: 杭州华大生命科学研究院 , 深圳华大生命科学研究院
Abstract: 本申请实施例提供了一种细胞区域确定方法及装置、电子设备及存储介质,属于细胞分割技术领域。细胞区域确定方法包括:从目标切片的空间转录数据中获取基因表达信息;其中,基因表达信息包括空间测序位点的位置信息以及对应的原始基因表达量;基于原始基因表达量将空间测序位点划分为细胞区域位点和非细胞区域位点;根据原始基因表达量以及位置信息在空间测序位点中确定第一种子位点;其中,第一种子位点为基于原始基因表达量与位置信息对多个空间测序位点进行聚类确定的聚类中心;根据第一种子位点确定目标种子位点,根据目标种子位点的位置信息以及细胞区域位点的位置信息确定目标切片的细胞区域。本申请实施例能够提高确定细胞区域的准确性。
-
-
-
-
-
-
-
-
-