基于多视角深度特征与多标签学习的RNA结合蛋白识别

    公开(公告)号:CN111445944B

    公开(公告)日:2023-04-18

    申请号:CN202010226916.4

    申请日:2020-03-27

    申请人: 江南大学

    IPC分类号: G16B5/00 G16B20/00 G06N3/0464

    摘要: 本发明属于智能细胞生物识别领域,涉及基于多视角深度特征与多标签学习的RNA结合蛋白识别。该方法包括训练阶段和使用阶段两部分,训练阶段包括初始多视角数据构造、深度多视角特征提取模型和多标签分类器训练。初始多视角数据构造使用分子生物学原理和统计学原理将原始的RNA序列转换成氨基酸序列和二肽成分,获得氨基酸序列和二肽成分特征,然后和原始的RNA序列一起构建成初始多视角特征,为初始多视角特征构建模型。本发明基于最初的多视角数据,利用CNN进行深度学习来构造出深度多视角特征,相对于原始多视角特征,经过深度特征提取的多视角特征具有更小的数据维度和更高的分类效果。

    融合多视角和最优多标签链式学习的RNA结合蛋白识别

    公开(公告)号:CN111816255A

    公开(公告)日:2020-10-23

    申请号:CN202010658127.8

    申请日:2020-07-09

    申请人: 江南大学

    IPC分类号: G16B30/00 G06N3/04 G06N3/08

    摘要: 本发明属于生物信息学领域,涉及融合多视角和最优多标签链式学习的RNA结合蛋白识别。该方法包括训练阶段和使用阶段两部分,训练阶段包括初始多视角数据构造、多视角深度特征提取模型训练,多标签特征学习和最优多标签链式分类器训练。多视角包括RNA序列视角,氨基酸序列视角,多间隙二肽成分视角和RNA序列语义视角。本发明为了提高多视角特征的有效性,基于最初的多视角数据,利用CNN进行深度学习来构造出深度多视角特征。为了将多视角特征与多标签学习联系在一起,本发明建立多标签特征学习模型,用于整合所有视角的优势,使用区别于普通CC多标签分类器的最优CC链式分类器来学习标签之间的关联,更有效地提升分类精度。

    一种面向仿真网络的链路数据采集方法

    公开(公告)号:CN108039965B

    公开(公告)日:2020-09-01

    申请号:CN201711283657.3

    申请日:2017-12-07

    申请人: 江南大学

    IPC分类号: H04L12/24 H04L12/26 H04L29/08

    摘要: 本发明公开了一种面向网络仿真的链路数据采集方法,涉及网络仿真技术领域,实现了OpenStack平台中的多样链路,包括宿主机内的虚拟链路,跨宿主机间的虚拟链路,虚实互联链路的分布式采集与存储。所述方法包括步骤:搭建OpenStack云平台基本环境;在Openstack平台上,搭建目标仿真网络,包含三种链路;用集合表示三种链路;部署总配置解析程序和采集程序;选择需要采集的链路,并进行配置,用部署总配置解析程序识别目标端口;对位于同一计算节点上的多个端口进行端口镜像的设置;启动数据采集程序,并实时对所采集到的数据进行存储。本发明通过提供一种面向仿真网络的数据采集方法,并将采集数据实时存储,为第三方应用研究提供数据支持。

    基于多视角深度特征与多标签学习的RNA结合蛋白识别

    公开(公告)号:CN111445944A

    公开(公告)日:2020-07-24

    申请号:CN202010226916.4

    申请日:2020-03-27

    申请人: 江南大学

    IPC分类号: G16B5/00 G16B20/00 G06N3/04

    摘要: 本发明属于智能细胞生物识别领域,涉及基于多视角深度特征与多标签学习的RNA结合蛋白识别。该方法包括训练阶段和使用阶段两部分,训练阶段包括初始多视角数据构造、深度多视角特征提取模型和多标签分类器训练。初始多视角数据构造使用分子生物学原理和统计学原理将原始的RNA序列转换成氨基酸序列和二肽成分,获得氨基酸序列和二肽成分特征,然后和原始的RNA序列一起构建成初始多视角特征,为初始多视角特征构建模型。本发明基于最初的多视角数据,利用CNN进行深度学习来构造出深度多视角特征,相对于原始多视角特征,经过深度特征提取的多视角特征具有更小的数据维度和更高的分类效果。

    一种基于0阶稀疏学习TSK模糊模型的白酒酒龄检测方法

    公开(公告)号:CN108645929A

    公开(公告)日:2018-10-12

    申请号:CN201810453476.9

    申请日:2018-05-10

    申请人: 江南大学

    IPC分类号: G01N30/02 G01N30/86 G06N7/02

    摘要: 本发明公开了一种基于0阶稀疏学习TSK模糊模型的白酒酒龄检测方法,包括以下步骤:1)、应用电子鼻对已知酒龄的待测白酒进行白酒挥发物质的检测,获得原始频率信号;2)、采用基于模糊子空间聚类的0阶稀疏学习TSK模糊模型对步骤1)所得的频率信号进行处理,建立白酒的鉴别模型;3)、采用电子鼻对待测的白酒进行白酒挥发物质的检测,然后采用步骤2)中得到的基于0阶稀疏学习TSK模糊模型的鉴别模型做出酒龄的判断。采用本发明的基于0阶稀疏学习TSK模糊模型的白酒酒龄检测方法可以快速、方便、准确的评判白酒的酒龄,检测灵敏度高,可以克服传统理化分析及人工感官品评的局限性,为白酒的质量评判提供了有效、简便的新方法。

    一种基于无监督模糊系统的脑功能磁共振图像分类方法

    公开(公告)号:CN108596228A

    公开(公告)日:2018-09-28

    申请号:CN201810330707.7

    申请日:2018-04-13

    申请人: 江南大学

    IPC分类号: G06K9/62

    摘要: 本发明公开了一种基于无监督模糊系统的脑功能磁共振图像分类方法,它涉及自闭症计算机辅助诊断技术领域。其步骤为:采集静息状态下的功能磁共振成像数据并进行预处理,选择AAL模板将大脑皮层分区,提取每个脑区的平均时间序列信号,使用皮尔逊相关系数计算得到低阶功能连接矩阵;基于低阶功能连接矩阵计算皮尔逊相关系数得到高阶功能连接矩阵,将每个对象的低阶和高阶脑功能连接矩阵分别拉直,使用基于流形正则化约束的无监督模糊系统进行降维,对降维后的低阶和高阶功能连接矩阵进行线性组合,使用SVM进行分类。本发明对静息态脑功能磁共振图像进行分类,将其应用于自闭症的计算机辅助诊断中,分类准确率高、泛化性能好、可解释性强。

    一种具备极大化知识利用能力的半监督图像分类方法

    公开(公告)号:CN107392230A

    公开(公告)日:2017-11-24

    申请号:CN201710483627.0

    申请日:2017-06-22

    申请人: 江南大学

    IPC分类号: G06K9/62

    摘要: 本发明公开了一种具备极大化知识利用能力的半监督图像分类方法。该方法针对一般图像分类技术里面专注于对图像数据预处理和特征筛选上,而在分类方法上并未有所突破,提出了一种具备极大化知识利用能力的半监督图像分类方法。该图像分类方法在首先考虑了现实情况下图像标记代价大的问题,从半监督方法着手,再对标记图像数据进行极大化挖掘,从有标记图像和无标记图像两个方面着手挖掘图像数据知识;同时,在图像数据的预处理和特征筛选上,采取了具有适用性的归一化和主成分分析征降维方法来事先处理图像数据,充分保证图像数据信息的完整性。

    面向小目标检测的快速核密度估计图像阈值分割方法

    公开(公告)号:CN102903112B

    公开(公告)日:2015-01-07

    申请号:CN201210376033.7

    申请日:2012-09-29

    申请人: 江南大学

    IPC分类号: G06T7/00

    摘要: 本发明涉及一种面向小目标检测的快速核密度估计图像阈值分割方法,该方法包括:读入图像,在计算机中得到该图像的灰度矩阵,并设置参数gate值;将图像中相同灰度级的像素点作为一个集合,如果该集合中的像素点数目Ni>gate,则使用FRSDE进行压缩;否则使用RSDE进行压缩;构建关系矩阵M来表示图像上不同灰度级之间的相互关系。将目标函数的求极值问题转化为基于矩阵区域的元素最小化求和问题,从而得到最佳阈值。本发明与已有技术相比,具有过程简单、易于实现、具有鲁棒性好与求解效率高等优点。因此,本发明为高分辨率图像的小目标检测问题提供了一种可行的方案;同时,为复杂背景下小目标图像的检测提供了一种行之有效的技术基础。

    基于多模态多注意力融合特征的蛋白质功能预测方法

    公开(公告)号:CN118016146A

    公开(公告)日:2024-05-10

    申请号:CN202410170159.1

    申请日:2024-02-06

    申请人: 江南大学

    IPC分类号: G16B15/00 G16B40/00 G16B50/10

    摘要: 本发明属于智能细胞生物识别领域,具体涉及一种基于多模态多注意力融合特征的蛋白质功能预测方法。该方法包括:序列特征的编码和预处理,基于接触图的结构信息编码,基于S‑C跨模态交叉注意融合网络的结构与序列特征融合,对于标签(GO注释)预测的模型的训练与预测4个阶段。本方法基于蛋白质氨基酸序列的独热编码特征与位置编码特征,构建了序列的语义信息提取网络,用于挖掘序列自身所蕴含的与功能有关的语义信息;同时,对于序列中每个氨基酸所携带的语义信息,设计了新的表示机制来聚合不同氨基酸对蛋白质功能的影响度;本发明实现不同模态特征的有效融合。最终通过标签预测器模块实现最终的蛋白质功能预测。