发明公开
- 专利标题: 基于神经网络的病毒宿主预测方法、系统及存储介质
-
申请号: CN202410247344.6申请日: 2024-03-05
-
公开(公告)号: CN117995267A公开(公告)日: 2024-05-07
- 发明人: 王勇 , 何鸿铭
- 申请人: 广东工业大学
- 申请人地址: 广东省广州市越秀区东风东路729号
- 专利权人: 广东工业大学
- 当前专利权人: 广东工业大学
- 当前专利权人地址: 广东省广州市越秀区东风东路729号
- 代理机构: 广州粤高专利商标代理有限公司
- 代理商 高棋
- 主分类号: G16B20/00
- IPC分类号: G16B20/00 ; G16B30/00 ; G16B40/20 ; G06F40/284 ; G06N3/0442 ; G06N3/045 ; G06N3/084 ; G06N3/0985
摘要:
本发明涉及机器学习领域,更具体地,基于神经网络的病毒宿主预测方法、系统及存储介质。其中方法包括:获取病毒基因序列;进行预处理;构建基于分词器和自适应特征学习嵌入层的编码模块进行编码;构建神经网络模对病毒基因序列特征相关关系进行训练,得到病毒宿主预测模型;得出病毒宿主预测结果并计算最终预测分数。本发明使用分词器和嵌入层矩阵来存储编码基因序列数据的特征信息,找出样本数据之间的特征相关关系训练为嵌入层矩阵,通过样本向量空间之间的特征相关关系来进行分类,用低维向量实现了编码,能表达出单词间的相关性。从而可以记录病毒基因组序列数据多元高阶相关关系,进而增加病毒宿主预测效果。