Invention Grant
CN108197434B 去除宏基因组测序数据中人源基因序列的方法
失效 - 权利终止
- Patent Title: 去除宏基因组测序数据中人源基因序列的方法
-
Application No.: CN201810041369.5Application Date: 2018-01-16
-
Publication No.: CN108197434BPublication Date: 2020-04-10
- Inventor: 苏政 , 肖卫民 , 苏闻 , 赵崇涛 , 黄瑞坤
- Applicant: 深圳市泰康吉音生物科技研发服务有限公司
- Applicant Address: 广东省深圳市福田区上梅林中康南路8号雕塑家园2443房
- Assignee: 深圳市泰康吉音生物科技研发服务有限公司
- Current Assignee: 深圳市泰康吉音生物科技研发服务有限公司
- Current Assignee Address: 广东省深圳市福田区上梅林中康南路8号雕塑家园2443房
- Agency: 东莞市神州众达专利商标事务所
- Agent 刘汉民
- Main IPC: G16B30/10
- IPC: G16B30/10 ; G16B30/20
Abstract:
本发明公开了一种去除宏基因组测序数据中人源基因序列的方法,该方法包括以下步骤:通过千人基因组计划样本的原始测序数据构建参考基因集,在得到千人基因组数据的高质量的测序read后,使用基因组组装软件将其组装成较长的基因片段,后续作为参考序列与测序read进行比对;提取来源于NCBI数据库中所有非肿瘤样本中的基因片段数据作为NCBI Bioproject的基因片段数据用作后续处理;将千人基因组的数据与NCBI Bioproject的数据合并,去冗余后变成非冗余的基因片段数据集;将非冗余的基因片段数据集中的的病毒基因组序列找出,从基因片段序列中去除;将病毒基因序列组去除后的基因片段序列作为去除宏基因组测序数据中人源序列的参考基因组。
Public/Granted literature
- CN108197434A 去除宏基因组测序数据中人源基因序列的方法 Public/Granted day:2018-06-22
Information query