一种基于深度学习的大肠杆菌启动子识别及强弱分类方法

    公开(公告)号:CN116705167A

    公开(公告)日:2023-09-05

    申请号:CN202310575873.4

    申请日:2023-05-22

    Applicant: 江南大学

    Abstract: 本发明公开了一种基于深度学习的大肠杆菌启动子识别及强弱分类方法,属于生物信息技术领域。所述方法包括:对基因序列进行数字化处理、对训练样本进行扩充、构建深度学习网络模型用于特征学习。本发明采用的残差网络结合自注意力机制,具有更深的网络深度并且可有效识别序列的小区段关键区域与全长序列的关联。相比于现有的采用一维卷积神经网络结合双向长短期记忆,其中,启动子真伪数据集仅包含6764个样本;启动子强弱数据集包含3382个样本。本发明旨在通过增加网络深度、数据集样本量来提高整体的判别精度,所构建的模型不仅可以用于启动子识别与强弱判定,且更有助于辅助挖掘强启动子。

Patent Agency Ranking