- 专利标题: 一种基于半监督学习框架的T细胞受体序列分类方法
-
申请号: CN202010291254.9申请日: 2020-04-14
-
公开(公告)号: CN111489792B公开(公告)日: 2022-12-09
- 发明人: 王嘉寅 , 边浩东 , 易鑫 , 张选平 , 王科 , 刘涛
- 申请人: 西安交通大学 , 北京吉因加科技有限公司
- 申请人地址: 陕西省西安市咸宁西路28号;
- 专利权人: 西安交通大学,北京吉因加科技有限公司
- 当前专利权人: 西安交通大学,北京吉因加科技有限公司
- 当前专利权人地址: 陕西省西安市咸宁西路28号;
- 代理机构: 西安通大专利代理有限责任公司
- 代理商 高博
- 主分类号: G16B40/20
- IPC分类号: G16B40/20 ; G06K9/62
摘要:
本发明公开了一种基于半监督学习框架的T细胞受体序列分类方法,选取CDR3β区域作为输入数据,对T细胞受体数据进行特征编码;根据得到的数据,选择支持向量机、随机森林和决策树的监督学习算法分别构造初始分类器C1、C2、C3;对初始分类器C1、C2、C3进行训练得到扩充的新训练集,产生的训练集进行可重复取样获得三个有标记训练集,然后从每个新训练集产生一个分类器,对分类器进行迭代更新;训练完成后,将三个分类器C1、C2、C3通过投票机制作为一个分类器集成进行使用。本发明适用于T细胞受体序列数据难以获得的情况,性能显著优于现有方法。
公开/授权文献
- CN111489792A 一种基于半监督学习框架的T细胞受体序列分类方法 公开/授权日:2020-08-04