一种蛋白质三磷酸腺苷绑定位点预测方法

    公开(公告)号:CN102760210A

    公开(公告)日:2012-10-31

    申请号:CN201210201382.5

    申请日:2012-06-19

    IPC分类号: G06F19/18

    摘要: 本发明公开了一种蛋白质三磷酸腺苷绑定位点预测方法。首先利用PSI-BLAST及PSIPRED程序获取蛋白质的进化信息和二级结构信息,并使用滑动窗口技术抽取每个氨基酸残基的特征;其次,利用随机下采样技术,对非绑定位点的样本进行多次随机下采样;然后,基于每次随机下采样得到的非绑定位点样本子集及绑定位点样本集训练一个SVM,对每个样本集的随机下采样得到多个SVM;最后,使用Dempster-Shafer证据理论对训练好的多个SVM进行集成。该方法优点在于:一是使用随机下采样技术,可以有效降低训练集的规模,加快模型训练速度;二是使用SVM集成技术,有效降低下采样导致的信息丢失,提高模型预测精度。

    一种可解释性的膜蛋白跨膜螺旋预测方法

    公开(公告)号:CN102831332A

    公开(公告)日:2012-12-19

    申请号:CN201210261613.1

    申请日:2012-07-27

    IPC分类号: G06F19/18

    摘要: 本发明公开了一种可解释性的膜蛋白跨膜螺旋预测方法。首先利用PSI-BLAST程序获取蛋白质的进化信息,并使用滑动窗口技术抽取每个氨基酸残基的特征;然后,利用自组织神经网络(SOM)学习跨膜螺旋在特征空间中的分布规律,将分布规律知识编码在SOM的权值向量中;最后,使用Wang-Mendel方法提取可解释性的模糊规则集;对于给定的待预测蛋白质的每个氨基酸残基使用模糊推理技术进行预测,得到预测曲线后,使用动态阈值分割技术确定每个氨基酸残基是否属于跨膜螺旋片段。优点在于:一是使用SOM学习,挖掘跨膜螺旋分布规律知识并降低原始数据的噪声;二是使用模糊规则提取技术获取的跨膜螺旋预测模型具有很高的可解释性。

    一种非参数膜蛋白跨膜螺旋预测方法

    公开(公告)号:CN102760209A

    公开(公告)日:2012-10-31

    申请号:CN201210153441.6

    申请日:2012-05-17

    IPC分类号: G06F19/10

    摘要: 本发明公开了一种非参数膜蛋白跨膜螺旋预测方法。首先利用PSI-BLAST程序获取蛋白质的进化信息,并使用滑动窗口技术抽取每个氨基酸残基的特征;然后,利用自组织神经网络(SOM)学习跨膜螺旋在特征空间中的分布规律,将分布规律知识编码在SOM的权值向量中;预测阶段,对给定的待预测蛋白质的每个氨基酸残基使用概率神经网络(PNN)非参数模型进行预测,得到预测曲线后,使用发明人自行提出的动态阈值分割技术确定每个氨基酸残基是否属于跨膜螺旋片段。优点在于:一是使用概率神经网络模型,使得预测模型仅需调节一个参数;二是使用学习得到的SOM的权向量作为PNN的基样本,保证了跨膜螺旋预测精度的同时提高了预测速度。

    一种基于人脸形状及广义自组织映射的性别识别方法

    公开(公告)号:CN102682294A

    公开(公告)日:2012-09-19

    申请号:CN201210153443.5

    申请日:2012-05-17

    IPC分类号: G06K9/00 G06T17/00

    摘要: 本发明公开了一种基于人脸形状及广义自组织映射的性别识别方法。首先,基于国际标准MAXPLANCK3D人脸数据库,使用PGA技术建立人脸3D形状恢复模型;然后,使用G-SOM对该3D人脸库进行学习,得到人脸性别3D特征的分布规律;在识别阶段,先使用PGASFS技术在3D形状恢复模型上恢复出2D人脸图像的3D形状信息,然后将恢复得到的3D形状信息输入G-SOM,并使用Soft-KNN算法进行性别识别。优点在于:一是有效降低人脸姿态、表情、照明条件变化对识别精度带来的不利影响;二是使用了G-SOM能更好地保持模式内蕴拓扑结构;三是性别鉴定方法利用了人脸的局部结构与整体结构之间的联系,提高了识别率。

    基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法

    公开(公告)号:CN112382347B

    公开(公告)日:2022-09-06

    申请号:CN202011290851.6

    申请日:2020-11-17

    发明人: 於东军 庄驰

    摘要: 本发明提出了一种基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法,首先使用ChemoPy工具包进行药物化合物分子指纹特征计算,然后利用PSI‑BLAST和PSI‑PRED软件对癌细胞系的多治疗靶点蛋白进行特征抽取;在此基础上,将药物化合物分子指纹特征和癌细胞系的多治疗靶点蛋白特征输入两阶段深度卷积神经网络,以多分类交叉熵损失函数作为目标进行网络训练及预测。本发明提高了协同抗癌药物组合的预测精度,加快了协同抗癌药物组合的识别速度。

    基于自注意力残差网络的DNA-蛋白质结合位点预测方法

    公开(公告)号:CN112382338B

    公开(公告)日:2022-09-06

    申请号:CN202011280189.6

    申请日:2020-11-16

    发明人: 於东军 申龙晨

    IPC分类号: G16B20/30 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于自注意力残差网络的DNA‑蛋白质结合位点预测方法,包括:对ChIP‑seq数据集进行同源性去除,对DNA序列进行编码,将DNA序列中的碱基转换为特征向量;对数据集进行随机下采样构建全局训练数据集Init‑Dataset;构建基于自注意力机制与残差结构的深度学习网络;将全局训练数据集输入基于自注意力机制与残差结构的深度学习网络对其进行训练;对深度学习网络进行迁移训练;将待预测DNA序列输入迁移训练好的深度学习网络,输出对应的DNA序列结合蛋白质的概率。本发明利用自注意力机制捕捉到序列的空间特征,残差网络提取了序列的高阶特征,二者结合使得网络的预测精度得到提升。

    基于碱基嵌入和直接相关分析的核糖核酸接触图预测方法

    公开(公告)号:CN111192627B

    公开(公告)日:2022-09-06

    申请号:CN201911288051.8

    申请日:2019-12-15

    IPC分类号: G16B15/00 G16B30/10

    摘要: 本发明公开了一种基于碱基嵌入和直接相关分析的核糖核酸接触图预测方法,包括:步骤1、碱基的嵌入法表示;步骤2、在嵌入空间构建直接相关模型;步骤3、基于自适应随机梯度下降的模型优化;步骤4、接触图提取及后处理。该方法是现有基于直接相关分析方法的核糖核酸接触图预测方法的拓展,具有灵活性和高效性。

    基于增强相互作用网络的关键蛋白质识别方法

    公开(公告)号:CN109801673B

    公开(公告)日:2022-09-06

    申请号:CN201811648606.0

    申请日:2018-12-30

    IPC分类号: G16B15/00 G16B40/00

    摘要: 本发明公开了一种基于增强相互作用网络的关键蛋白质识别方法,利用亚细胞定位和蛋白质复合物来度量原始的相互作用网络中相互作用真实存在的可能性,并将其作为相互作用的权重,从而构建起一个加权的、可靠的网络;针对上述加权网络中的相互作用,使用可信边聚集系数计算其在网络中所处位置的集聚程度;根据蛋白质结构域特异性,计算加权网络中蛋白质分子的结构域特异性得分,并进一步计算出相互作用的结构域特异性得分;结合相互作用的可信边聚集系数和结构域特异性得分,计算加权网络中所有蛋白质分子的关键性得分,根据得分高低排序并输出结果。使用本发明的方法可以更加准确且全面的评估蛋白质的关键性,提高识别精度。

    基于L2,1范数和拉普拉斯流形的RLSDSPCA降维方法

    公开(公告)号:CN114139606A

    公开(公告)日:2022-03-04

    申请号:CN202111319593.4

    申请日:2021-11-09

    IPC分类号: G06K9/62 G16B35/00

    摘要: 本发明提供一种基于L2,1范数和拉普拉斯流形的RLSDSPCA降维方法,对基因表达数据进行特征基因选择和癌症样本分类。通过降维方法对基因表达数据进行数据降维,对降维后的数据进行特征基因选择和癌症样本分类。本发明有效地提高了基因表达数据特征基因的选择水平和癌症样本的分类效果。

    一种快速小分子结构对齐方法

    公开(公告)号:CN107526939B

    公开(公告)日:2020-10-16

    申请号:CN201710519939.2

    申请日:2017-06-30

    IPC分类号: G16B15/00 G16C10/00

    摘要: 本发明公开了一种快速小分子结构对齐方法,读取待对齐的两个小分子结构对象,提取所有原子的三维坐标与类型;根据原子类型提取对应的相对原子质量;通过计算所有来自不同小分子的原子对之间的相对原子质量差值,得到初始得分矩阵,使用贪心算法在该初始得分矩阵上求得初始化的对齐信息;在已知的对齐信息下,计算已对齐原子坐标之间的旋转平移矩阵,使用该矩阵叠加两个小分子的三维结构,使得两个小分子在三维空间中尽可能重叠,再通过一个基于三维坐标的打分函数得到一个新的得分矩阵,然后使用贪心算法搜索该得分矩阵得到新的对齐信息,来更新旧的对齐信息;重复上一步直至对齐信息无法更新或达到重复的上限次数,最终的对齐信息就是所求得的解。