基于稀疏编码及链学习预测膜蛋白beta‑barrel跨膜区域的方法
摘要:
一种基于稀疏编码及链学习预测膜蛋白beta‐barrel跨膜区域的方法。本发明涉及到稀疏编码技术、链学习算法、支持向量机,利用计算的方法对膜蛋白beta‑barrel跨膜区域进行结构预测,为研究蛋白质结构和功能提供重要信息。本发明创新性的引入数字图像处理的思想,对蛋白质特征矩阵进行稀疏编码,解决了特征降维和去除噪声的问题。从蛋白质数据库PDB中组织膜蛋白beta‑barrel数据集,分别提取代表氨基酸进化信息的位置特异性打分矩阵和代表氨基酸残基位置信息的Z score为特征,用滑动窗口提取特征向量,实现多特征融合,提出基于SVM分类器的链学习算法训练模型,显著提高了预测效果,经Jakenife交叉验证精度可以达到92.5%。
0/0