-
公开(公告)号:CN116312765A
公开(公告)日:2023-06-23
申请号:CN202310122535.5
申请日:2023-02-15
申请人: 成都信息工程大学
IPC分类号: G16B20/20 , G16B40/20 , G16B30/00 , G06N3/0464
摘要: 本发明提供了一种基于多阶段的非编码变异对增强子活性影响预测方法,涉及生物信息技术领域,该方法包括获取增强子相关特征,并对其进行预处理;构建并训练基于元学习的染色质特征预测模型;基于特征融合模型得到融合多染色质特征的联合表征;构建和训练基于多染色质特征联合表征的增强子活性预测模型;利用染色质特征预测模型以及增强子活性预测模型预测变异对增强子活性的影响;根据变异对增强子活性的影响,对功能性变异进行筛选。本发明提出了一个有效的增强子活性预测框架,实现变异对增强子活性影响的精确预测,解决了传统方法基于DNA序列进行预测,效果不佳的缺点。
-
公开(公告)号:CN116386720A
公开(公告)日:2023-07-04
申请号:CN202310383948.9
申请日:2023-04-11
申请人: 成都信息工程大学
摘要: 本发明公开了一种基于深度学习和注意力机制的单细胞转录因子预测方法,其包括获取单细胞染色质可及性分析测序数据,并对其进行预处理,之后进行数据增强操作,得到增强测序数据;提取增强测序数据中的回归峰作为特征向量S,拼接正向和反向的增强测序数据作为特征向量A,将取自全基因组的DNA序列数据转换为特征向量U;拼接特征向量S、特征向量A和特征向量U,并输入深度网络模型预测单细胞中每个转录因子的概率,深度网络模型包括卷积模块和通道注意力模型。
-
公开(公告)号:CN116884499A
公开(公告)日:2023-10-13
申请号:CN202310858474.9
申请日:2023-07-12
IPC分类号: G16B40/00 , G16B25/10 , G06N3/0455 , G06N3/084
摘要: 本发明公开了基于变分自编码器的单细胞转录因子调控网络构建方法,涉及基因转录调控领域,该方法包括:根据scATAC‑seq数据和scRNA‑seq数据,确定输入矩阵和真实标签矩阵;构建转录因子调控网络模型,并根据输入矩阵和转录因子调控网络模型确定预测标签矩阵;根据真实标签矩阵和预测标签矩阵,确定转录因子调控网络模型损失;采用双级优化策略对转录因子调控网络模型的内部参数进行更新;采用更新内部参数后的转录因子调控网络模型构建转录因子调控网络。本发明能提取并对齐单细胞ATAC‑seq和单细胞RNA‑seq数据中的高阶特征,结构化转录因子的调控关系,进而更全面准确地构建转录因子调控网络。
-
公开(公告)号:CN116153404B
公开(公告)日:2023-08-15
申请号:CN202310182496.8
申请日:2023-02-28
申请人: 成都信息工程大学
IPC分类号: G16B25/00 , G16B40/00 , G06N3/0455
摘要: 本发明公开了一种单细胞ATAC‑seq数据分析方法,通过提取单细胞分辨率的染色质可达性特征峰序列中转录因子‑DNA结合基元的所属种类、相对位置、长距离依赖关系等众多转录调控语法规则,从而更全面地表示单个细胞的功能状态和高阶特征。此外,本发明方法利用获取的转录调控语法规则、细胞功能状态和高阶特征,一站式地实现染色质可达性预测、细胞类型注释、染色质可达性图谱降噪、转录因子活性推断等一系列下游分析任务。
-
公开(公告)号:CN115938592A
公开(公告)日:2023-04-07
申请号:CN202310220890.6
申请日:2023-03-09
申请人: 成都信息工程大学
IPC分类号: G16H50/30 , G06F18/25 , G16B20/10 , G06N3/0464 , G06N3/0455 , G06N3/08
摘要: 本发明公开了一种基于局部增强图卷积网络的癌症预后预测方法,属于医学技术领域,包括以下步骤:S1:获取多组学数据和通路原始数据,并利用多组学数据路和通路原始数据构建无向图;S2:对无向图进行局部增强;S3:利用图卷积网络对局部增强后的无向图进行特征提取和特征融合,得到整体特征映射组合;S4:根据整体特征映射组合,构建比例风险模型,将整体特征映射组合输入至比例风险模型中,确定患者生存风险。本发明通过对癌症相关组学数据构建图神经网络学习,对患者进行预后预测及分析,可以为生物实验提供一定指导,从而有效减少实验时间与节省实验成本。
-
公开(公告)号:CN116153404A
公开(公告)日:2023-05-23
申请号:CN202310182496.8
申请日:2023-02-28
申请人: 成都信息工程大学
IPC分类号: G16B25/00 , G16B40/00 , G06N3/0455
摘要: 本发明公开了一种单细胞ATAC‑seq数据分析方法,通过提取单细胞分辨率的染色质可达性特征峰序列中转录因子‑DNA结合基元的所属种类、相对位置、长距离依赖关系等众多转录调控语法规则,从而更全面地表示单个细胞的功能状态和高阶特征。此外,本发明方法利用获取的转录调控语法规则、细胞功能状态和高阶特征,一站式地实现染色质可达性预测、细胞类型注释、染色质可达性图谱降噪、转录因子活性推断等一系列下游分析任务。
-
公开(公告)号:CN115938592B
公开(公告)日:2023-05-05
申请号:CN202310220890.6
申请日:2023-03-09
申请人: 成都信息工程大学
IPC分类号: G16H50/30 , G06F18/25 , G16B20/10 , G06N3/0464 , G06N3/0455 , G06N3/08
摘要: 本发明公开了一种基于局部增强图卷积网络的癌症预后预测方法,属于医学技术领域,包括以下步骤:S1:获取多组学数据和通路原始数据,并利用多组学数据路和通路原始数据构建无向图;S2:对无向图进行局部增强;S3:利用图卷积网络对局部增强后的无向图进行特征提取和特征融合,得到整体特征映射组合;S4:根据整体特征映射组合,构建比例风险模型,将整体特征映射组合输入至比例风险模型中,确定患者生存风险。本发明通过对癌症相关组学数据构建图神经网络学习,对患者进行预后预测及分析,可以为生物实验提供一定指导,从而有效减少实验时间与节省实验成本。
-
公开(公告)号:CN115810398A
公开(公告)日:2023-03-17
申请号:CN202211696499.5
申请日:2022-12-28
申请人: 成都信息工程大学
摘要: 本发明公开了一种基于多特征融合的TF‑DNA结合识别方法,包括:S1:获得人类常见组织的五种与转录因子结合相关的原始数据;S2:对多种数据进行预处理;S3:对预处理后的原始数据中的DNA序列数据进行数据编码处理;S4:对预处理后的原始数据中的其他数据进行归一化处理;S5:利用多特征融合的自注意力机制和卷积神经网络对编码后的DNA序列数据和归一化后的数据进行全局依赖提取、特征提取和特征融合,得到整体特征映射组合;S6:根据整体特征映射组合,对多特征融合的TF‑DNA结合识别模型进行训练,得到训练后的多特征融合的TF‑DNA结合识别模型;S7:利用训练后的多特征融合的TF‑DNA结合识别模型对待识别数据进行识别。
-
-
-
-
-
-
-