基于稀疏编码及链学习预测膜蛋白beta‑barrel跨膜区域的方法

    公开(公告)号:CN104615911B

    公开(公告)日:2017-07-18

    申请号:CN201510012812.2

    申请日:2015-01-12

    发明人: 沈红斌 殷曦

    IPC分类号: G06F19/18

    摘要: 一种基于稀疏编码及链学习预测膜蛋白beta‐barrel跨膜区域的方法。本发明涉及到稀疏编码技术、链学习算法、支持向量机,利用计算的方法对膜蛋白beta‑barrel跨膜区域进行结构预测,为研究蛋白质结构和功能提供重要信息。本发明创新性的引入数字图像处理的思想,对蛋白质特征矩阵进行稀疏编码,解决了特征降维和去除噪声的问题。从蛋白质数据库PDB中组织膜蛋白beta‑barrel数据集,分别提取代表氨基酸进化信息的位置特异性打分矩阵和代表氨基酸残基位置信息的Z score为特征,用滑动窗口提取特征向量,实现多特征融合,提出基于SVM分类器的链学习算法训练模型,显著提高了预测效果,经Jakenife交叉验证精度可以达到92.5%。

    基于优化证据理论的K最近邻预测alpha螺旋的方法

    公开(公告)号:CN104537277A

    公开(公告)日:2015-04-22

    申请号:CN201410820864.8

    申请日:2014-12-22

    发明人: 沈红斌 殷曦

    IPC分类号: G06F19/16 G06F17/30 G06K9/66

    摘要: 一种基于优化证据理论的K最近邻预测膜蛋白alpha螺旋的方法,涉及到模式识别算法和计算生物学相关技术。本发明能够在缺少高分辨率已知结构的蛋白质样本时,精确预测膜蛋白alpha螺旋结构。本发明通过计算生物的方法,包括蛋白质多序列比对,OET-KNN算法,融合多个滑动窗口提取特征向量进行优化,再用中值滤波的方法平滑噪声,然后对预测结果利用动态阈值的方法进行分割,最终得到膜蛋白alpha螺旋的结构。通过本发明将alpha螺旋的预测精度提高20%以上,而且能够预测alpha螺旋的末端并对预测长度小于15个氨基酸的不规则alpha螺旋有很好的效果。

    基于稀疏编码及链学习预测膜蛋白beta-barrel跨膜区域的方法

    公开(公告)号:CN104615911A

    公开(公告)日:2015-05-13

    申请号:CN201510012812.2

    申请日:2015-01-12

    发明人: 沈红斌 殷曦

    IPC分类号: G06F19/18

    摘要: 一种基于稀疏编码及链学习预测膜蛋白beta‐barrel跨膜区域的方法。本发明涉及到稀疏编码技术、链学习算法、支持向量机,利用计算的方法对膜蛋白beta-barrel跨膜区域进行结构预测,为研究蛋白质结构和功能提供重要信息。本发明创新性的引入数字图像处理的思想,对蛋白质特征矩阵进行稀疏编码,解决了特征降维和去除噪声的问题。从蛋白质数据库PDB中组织膜蛋白beta-barrel数据集,分别提取代表氨基酸进化信息的位置特异性打分矩阵和代表氨基酸残基位置信息的Z score为特征,用滑动窗口提取特征向量,实现多特征融合,提出基于SVM分类器的链学习算法训练模型,显著提高了预测效果,经Jakenife交叉验证精度可以达到92.5%。