基于多阶段的非编码变异对增强子活性影响预测方法

    公开(公告)号:CN116312765A

    公开(公告)日:2023-06-23

    申请号:CN202310122535.5

    申请日:2023-02-15

    摘要: 本发明提供了一种基于多阶段的非编码变异对增强子活性影响预测方法,涉及生物信息技术领域,该方法包括获取增强子相关特征,并对其进行预处理;构建并训练基于元学习的染色质特征预测模型;基于特征融合模型得到融合多染色质特征的联合表征;构建和训练基于多染色质特征联合表征的增强子活性预测模型;利用染色质特征预测模型以及增强子活性预测模型预测变异对增强子活性的影响;根据变异对增强子活性的影响,对功能性变异进行筛选。本发明提出了一个有效的增强子活性预测框架,实现变异对增强子活性影响的精确预测,解决了传统方法基于DNA序列进行预测,效果不佳的缺点。

    一种基于多特征融合的TF-DNA结合识别方法

    公开(公告)号:CN115810398A

    公开(公告)日:2023-03-17

    申请号:CN202211696499.5

    申请日:2022-12-28

    IPC分类号: G16B30/10 G16B5/00

    摘要: 本发明公开了一种基于多特征融合的TF‑DNA结合识别方法,包括:S1:获得人类常见组织的五种与转录因子结合相关的原始数据;S2:对多种数据进行预处理;S3:对预处理后的原始数据中的DNA序列数据进行数据编码处理;S4:对预处理后的原始数据中的其他数据进行归一化处理;S5:利用多特征融合的自注意力机制和卷积神经网络对编码后的DNA序列数据和归一化后的数据进行全局依赖提取、特征提取和特征融合,得到整体特征映射组合;S6:根据整体特征映射组合,对多特征融合的TF‑DNA结合识别模型进行训练,得到训练后的多特征融合的TF‑DNA结合识别模型;S7:利用训练后的多特征融合的TF‑DNA结合识别模型对待识别数据进行识别。