- 专利标题: 一种测序数据GC偏向性校正的方法及其装置
-
申请号: CN202010436420.X申请日: 2020-05-21
-
公开(公告)号: CN111627498A公开(公告)日: 2020-09-04
- 发明人: 林浩翔 , 况霓 , 黄毅 , 易鑫 , 杨玲 , 吴玲清
- 申请人: 北京吉因加医学检验实验室有限公司 , 深圳吉因加医学检验实验室
- 申请人地址: 北京市昌平区回龙观镇生命园路8号院一区2号-1至5层101(5层501、502室)(昌平示范园)
- 专利权人: 北京吉因加医学检验实验室有限公司,深圳吉因加医学检验实验室
- 当前专利权人: 北京吉因加医学检验实验室有限公司,深圳吉因加医学检验实验室
- 当前专利权人地址: 北京市昌平区回龙观镇生命园路8号院一区2号-1至5层101(5层501、502室)(昌平示范园)
- 代理机构: 北京三聚阳光知识产权代理有限公司
- 代理商 廖慧敏
- 主分类号: G16B20/30
- IPC分类号: G16B20/30 ; G16B30/10 ; G16B40/00
摘要:
一种测序数据GC偏向性校正的方法,包括如下步骤:获取基因组的测序数据比对数据可供计算分析区间R;从可供计算分析区间R中获取最高频率片段长度数F;通过对区间R进行不重复的抽样,抽样数N小于或等于区间R的总长度;计算每一个抽出的位置P对应的如下A)-B)的参数:A)位置P到位置P+F之间的序列中的G碱基和C碱基的个数之和Gp;B)位置P上比对片段数Fp,所述比对片段的起始位置为位置P;汇总每一个位置上述的数值,对每一个Gp值进行分层统计,最终计算每一个Gp值对应的GC片段比例;将测序深度除以Rgc进行测序深度计算修正。本发明的GC偏向性校正方法构建的模型,修正效果好。
公开/授权文献
- CN111627498B 一种测序数据GC偏向性校正的方法及其装置 公开/授权日:2022-10-04