一种基于染色质交互高精度预测玉米基因表达量的方法
摘要:
本发明公开了一种基于染色质交互高精度预测玉米基因表达量的方法,其特征在于,该方法通过构建的DeepCBA模型实现,包括:对输入染色质序列进行one‑hot编码处理;将编码后的序列输入卷积神经网络,实现特征降维和特征提取。为了捕获序列中的时序特征,利用双向长短期记忆网络捕获隐藏在DNA序列中的时序特征,得到两个向量矩阵,垂直拼接两个向量矩阵。使用注意力机制增强关键特征对模型的贡献,并使用Dropout防止过拟合等。在输出层,使用sigmoid/linear函数完成相应的基于启动子近端和远端染色质交互的玉米基因表达量预测;并识别和挖掘玉米染色质序列中潜在的重要基序。本发明实现了对基因表达量的从头预测,进而为基因表达量精准设计乃至未来智能育种提供了新的思路。
0/0