-
公开(公告)号:CN118824350B
公开(公告)日:2024-11-26
申请号:CN202411296576.7
申请日:2024-09-18
IPC: G16B5/00 , G16B40/00 , G06N3/0442 , G06N3/0895
Abstract: 本发明公开了一种单细胞分化轨迹推断方法,涉及细胞分化轨迹分析技术领域,本方法基于DNA序列和RNA序列进行建模,同时预测染色质可及性和基因表达状态,并整合成对的单细胞多组学数据,将分类器的权重作为两种组学的细胞低维特征,利用对比学习学习其中的细胞异质性,提高单细胞的聚类准确率,进而构建准确的单细胞的分化轨迹。本方法采用轻量级深度学习模型,避免了当前众多基于编码解码器结构的单细胞数据融合模型训练困难的尴尬处境,还可以提高数据处理效率。本方法考虑到细胞异质性对于单细胞多组学数据融合的影响,利用对比学习,能够更精准地刻画多组学数据中的单细胞特征,为准确聚类打下基础。
-
公开(公告)号:CN116153404B
公开(公告)日:2023-08-15
申请号:CN202310182496.8
申请日:2023-02-28
Applicant: 成都信息工程大学
IPC: G16B25/00 , G16B40/00 , G06N3/0455
Abstract: 本发明公开了一种单细胞ATAC‑seq数据分析方法,通过提取单细胞分辨率的染色质可达性特征峰序列中转录因子‑DNA结合基元的所属种类、相对位置、长距离依赖关系等众多转录调控语法规则,从而更全面地表示单个细胞的功能状态和高阶特征。此外,本发明方法利用获取的转录调控语法规则、细胞功能状态和高阶特征,一站式地实现染色质可达性预测、细胞类型注释、染色质可达性图谱降噪、转录因子活性推断等一系列下游分析任务。
-
公开(公告)号:CN118824350A
公开(公告)日:2024-10-22
申请号:CN202411296576.7
申请日:2024-09-18
IPC: G16B5/00 , G16B40/00 , G06N3/0442 , G06N3/0895
Abstract: 本发明公开了一种单细胞分化轨迹推断方法,涉及细胞分化轨迹分析技术领域,本方法基于DNA序列和RNA序列进行建模,同时预测染色质可及性和基因表达状态,并整合成对的单细胞多组学数据,将分类器的权重作为两种组学的细胞低维特征,利用对比学习学习其中的细胞异质性,提高单细胞的聚类准确率,进而构建准确的单细胞的分化轨迹。本方法采用轻量级深度学习模型,避免了当前众多基于编码解码器结构的单细胞数据融合模型训练困难的尴尬处境,还可以提高数据处理效率。本方法考虑到细胞异质性对于单细胞多组学数据融合的影响,利用对比学习,能够更精准地刻画多组学数据中的单细胞特征,为准确聚类打下基础。
-
公开(公告)号:CN116312765A
公开(公告)日:2023-06-23
申请号:CN202310122535.5
申请日:2023-02-15
Applicant: 成都信息工程大学
IPC: G16B20/20 , G16B40/20 , G16B30/00 , G06N3/0464
Abstract: 本发明提供了一种基于多阶段的非编码变异对增强子活性影响预测方法,涉及生物信息技术领域,该方法包括获取增强子相关特征,并对其进行预处理;构建并训练基于元学习的染色质特征预测模型;基于特征融合模型得到融合多染色质特征的联合表征;构建和训练基于多染色质特征联合表征的增强子活性预测模型;利用染色质特征预测模型以及增强子活性预测模型预测变异对增强子活性的影响;根据变异对增强子活性的影响,对功能性变异进行筛选。本发明提出了一个有效的增强子活性预测框架,实现变异对增强子活性影响的精确预测,解决了传统方法基于DNA序列进行预测,效果不佳的缺点。
-
公开(公告)号:CN119479808A
公开(公告)日:2025-02-18
申请号:CN202411301445.3
申请日:2024-09-18
IPC: G16B30/00 , G16B40/00 , G16B5/00 , G06F18/10 , G06F18/25 , G06F18/241 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/0895
Abstract: 本发明公开了一种单细胞数据降噪方法,涉及细胞数据处理领域,本方法基于DNA序列和RNA序列进行建模,同时预测染色质可及性和基因表达状态,并整合成对的单细胞多组学数据,将分类器的权重作为两种组学的细胞低维特征,利用对比学习学习其中的细胞异质性,刻画单细胞数据的真实轮廓和生物学信息,对单细胞数据集进行有效降噪。
-
公开(公告)号:CN116884500A
公开(公告)日:2023-10-13
申请号:CN202310861912.7
申请日:2023-07-13
Abstract: 本发明公开了一种交互式单细胞ATAC‑seq数据分析系统及方法,本发明以scATAC‑seq特征峰的DNA序列作为数据集,利用基于scATAC‑seq特征峰的DNA序列作为数据集以此完成各个序列特征峰在各细胞中的染色质可及性、单细胞聚类、单细胞ATAC‑seq数据降噪、转录因子活性推断的任务。进一步地,本发明基于LoRA微调、Prefix微调与Adapter微调将预训练大模型适配到各个分析任务中,并以此搭建在线的交互式分析平台,有效降低了微调大型预训练模型的成本,使得生物信息学家可以轻松地进行单细胞ATAC‑seq数据分析,而无需掌握编程知识。
-
公开(公告)号:CN116153404A
公开(公告)日:2023-05-23
申请号:CN202310182496.8
申请日:2023-02-28
Applicant: 成都信息工程大学
IPC: G16B25/00 , G16B40/00 , G06N3/0455
Abstract: 本发明公开了一种单细胞ATAC‑seq数据分析方法,通过提取单细胞分辨率的染色质可达性特征峰序列中转录因子‑DNA结合基元的所属种类、相对位置、长距离依赖关系等众多转录调控语法规则,从而更全面地表示单个细胞的功能状态和高阶特征。此外,本发明方法利用获取的转录调控语法规则、细胞功能状态和高阶特征,一站式地实现染色质可达性预测、细胞类型注释、染色质可达性图谱降噪、转录因子活性推断等一系列下游分析任务。
-
公开(公告)号:CN115810398A
公开(公告)日:2023-03-17
申请号:CN202211696499.5
申请日:2022-12-28
Applicant: 成都信息工程大学
Abstract: 本发明公开了一种基于多特征融合的TF‑DNA结合识别方法,包括:S1:获得人类常见组织的五种与转录因子结合相关的原始数据;S2:对多种数据进行预处理;S3:对预处理后的原始数据中的DNA序列数据进行数据编码处理;S4:对预处理后的原始数据中的其他数据进行归一化处理;S5:利用多特征融合的自注意力机制和卷积神经网络对编码后的DNA序列数据和归一化后的数据进行全局依赖提取、特征提取和特征融合,得到整体特征映射组合;S6:根据整体特征映射组合,对多特征融合的TF‑DNA结合识别模型进行训练,得到训练后的多特征融合的TF‑DNA结合识别模型;S7:利用训练后的多特征融合的TF‑DNA结合识别模型对待识别数据进行识别。
-
-
-
-
-
-
-