-
公开(公告)号:CN116741308A
公开(公告)日:2023-09-12
申请号:CN202310718986.5
申请日:2023-06-16
Applicant: 安徽农业大学
IPC: G16C20/50 , G16C20/70 , G06N3/042 , G06N3/047 , G06N3/082 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种基于HGT和随机自编码器的环状RNA‑药物关联预测方法,包括以下步骤:A、随机生成C和D两个向量分别表示circRNA和药物的编码,然后将它们分别输入到全连接层中进行编码,作为自编码器的一部分;B、将交互运算符的权重矩阵参数化为三个部分:源节点的投影、边缘的投影和目标节点的投影;然后,通过对每个边缘计算头注意力得分来计算源节点和目标节点之间的互注意力;C、将信息从源节点传递到目标节点;同时将元边缘关系整合到消息传递过程中;D、构建基于节点和边缘元关系的多层HGT模型,将每轮HGT操作的输出编码串联起来作为最终编码,得到新的circRNA‑药物敏感性关联矩阵。本发明能够更准确地预测circRNA和药物敏感性之间的关联。
-
公开(公告)号:CN117892731A
公开(公告)日:2024-04-16
申请号:CN202410087114.8
申请日:2024-01-22
Applicant: 安徽农业大学
IPC: G06F40/295 , G06F16/35 , G06N3/0442 , G06N3/0455 , G06N3/047 , G06N3/094 , G06N3/048
Abstract: 本发明公开了一种基于多智能体通信的玉米病虫害领域命名实体识别方法,包括以下步骤:步骤1、获取玉米病虫害及相关基因的文本数据;步骤2、对文本数据进行实体标注得到标注文本数据,并划分为训练集、测试集和验证集,步骤3、构建包括ERNIE层、BiLSTM层、初始边界标记块、多智能体通信层、边界标记模块层、CRF层的实体识别模型;步骤4、采用训练集配合测试集、验证集对实体识别模型进行训练得到玉米病虫害领域命名实体识别模型;步骤5、将待识别的玉米病虫害领域命名实体输入至玉米病虫害领域命名实体识别模型。本发明能够从相应的玉米病虫害领域数据集中识别相关的玉米病虫害领域实体边界和类别。
-
公开(公告)号:CN117094325B
公开(公告)日:2024-03-29
申请号:CN202311240372.7
申请日:2023-09-25
Applicant: 安徽农业大学
IPC: G06F40/295 , G06F40/30 , G06N3/042 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种水稻病虫害领域命名实体识别方法,包括以下步骤:步骤S1、获取水稻病虫害领域实体的文本数据;步骤S2、对部分文本数据按实体进行数据标注构建训练集,其余为未标注文本数据;步骤S3、构建识别模型,利用训练集对识别模型进行训练得到基准模型;步骤S4、利用基准模型预测未标注文本数据得到带有伪标签的文本数据;将带有伪标签的文本数据扩充训练集对基准模型进行训练,得到最终识别模型;步骤S5、利用最终识别模型识别水稻病虫害实体。本发明解决了缺乏训练数据、实体结构复杂、实体类型多样、实体分布不均问题、解决缺乏训练数据问题,减少当前大多数命名实体识别模型对高质量标注数据集的依赖。
-
公开(公告)号:CN117238366A
公开(公告)日:2023-12-15
申请号:CN202311185012.1
申请日:2023-09-13
Applicant: 安徽农业大学
Abstract: 本发明公开了一种基于异构图变换器计算疾病与RNA关联的方法,涉及疾病预测技术领域,包括:S1:数据集构建;S2:多视图相似性度量模块构建;S3:自编码器模块进行构建;S4:对异构图变换器模块进行优化;S5:构建内积解码器模块;该基于异构图变换器计算疾病与RNA关联的方法,通过基于异构图转换器的计算方法VRMHMD,预测miRNA‑疾病之间的关联,VRMHMD在多模式编码的基础上增加了一个随机自动编码过程,对两组数据进行编码,并通过两个不同的多层HGT网络提取编码,来自HGT每层的输出编码被连接作为最终编码,使用注意力机制来融合这两组编码,并执行矩阵乘法解码,以预测新的miRNA疾病敏感性关联矩阵。
-
公开(公告)号:CN117094325A
公开(公告)日:2023-11-21
申请号:CN202311240372.7
申请日:2023-09-25
Applicant: 安徽农业大学
IPC: G06F40/295 , G06F40/30 , G06N3/042 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种水稻病虫害领域命名实体识别方法,包括以下步骤:步骤S1、获取水稻病虫害领域实体的文本数据;步骤S2、对部分文本数据按实体进行数据标注构建训练集,其余为未标注文本数据;步骤S3、构建识别模型,利用训练集对识别模型进行训练得到基准模型;步骤S4、利用基准模型预测未标注文本数据得到带有伪标签的文本数据;将带有伪标签的文本数据扩充训练集对基准模型进行训练,得到最终识别模型;步骤S5、利用最终识别模型识别水稻病虫害实体。本发明解决了缺乏训练数据、实体结构复杂、实体类型多样、实体分布不均问题、解决缺乏训练数据问题,减少当前大多数命名实体识别模型对高质量标注数据集的依赖。
-
公开(公告)号:CN116798514A
公开(公告)日:2023-09-22
申请号:CN202310720219.8
申请日:2023-06-18
Applicant: 安徽农业大学
IPC: G16B20/30 , G16B40/20 , G16B40/30 , G06N3/045 , G06N3/047 , G06N3/048 , G06N3/088 , G06N3/096 , G06N3/0985 , G06F16/35 , G06F18/214 , G06F18/243 , G06F18/25
Abstract: 本发明公开了一种预测生物赖氨酸乙酰化位点的方法,涉及涉及生物学乙酰化研究领域,预先训练了一个用于Kace位点预测的领域特异性BERT模型,并对其进行了微调,以适应物种的特异性,预先训练好的BERT模型为表示蛋白质序列的内在信息提供了一个有效的工具,在web服务器上公开源码和数据集,利用BERT‑Kace模型预测位点,通过输入蛋白质序列来预测位点。解决了从蛋白质序列中提取的手工特征,基于经验可能不能表征蛋白质序列中所包含的所有生物信息,无法更好的挖掘序列中的生物信息的问题。
-
-
-
-
-