发明授权
CN104899477B 一种使用词袋模型的蛋白质亚细胞区间预测方法
失效 - 权利终止
- 专利标题: 一种使用词袋模型的蛋白质亚细胞区间预测方法
-
申请号: CN201510341211.6申请日: 2015-06-18
-
公开(公告)号: CN104899477B公开(公告)日: 2018-01-26
- 发明人: 张梁 , 薛卫 , 赵南
- 申请人: 江南大学 , 南京农业大学
- 申请人地址: 江苏省无锡市滨湖区蠡湖大道1800号
- 专利权人: 江南大学,南京农业大学
- 当前专利权人: 江南大学,南京农业大学
- 当前专利权人地址: 江苏省无锡市滨湖区蠡湖大道1800号
- 代理机构: 无锡华源专利商标事务所
- 代理商 林弘毅; 聂汉钦
- 主分类号: G06F19/24
- IPC分类号: G06F19/24
摘要:
本发明公开了一种使用词袋模型的蛋白质亚细胞区间预测方法,利用滑动窗口方法分割蛋白质序列,获得大量序列单词的集合,运用氨基酸组成获得序列单词特征,对序列单词特征进行聚类分析构建字典,并通过统计计算获得蛋白质序列的词袋特征,最后将词袋特征送入支持向量机多类分类器进行蛋白质亚细胞区间预测。可通过实验证明本发明能有效提高识别精度,尤其在传统方法预测准确率较低的亚细胞类上识别精度明显提高,对准确预测未知蛋白的亚细胞位置具有重要作用。
公开/授权文献
- CN104899477A 一种使用词袋模型的蛋白质亚细胞区间预测方法 公开/授权日:2015-09-09