一种二代测序平台的基因组数据高效利用方法和装置

    公开(公告)号:CN111445956B

    公开(公告)日:2021-06-22

    申请号:CN202010328112.5

    申请日:2020-04-23

    IPC分类号: G16B30/10

    摘要: 本发明公开了一种二代测序平台的基因组数据高效利用方法和装置,其中,所述方法包括:(1)对二代测序原始数据进行质控,质控中保留中部或尾部包含接头序列的读对;(2)质控达标的数据与参考基因组进行比对后,获得全长比对、部分比对以及未比对上三种比对情况;(3)针对三种比对情况,分别捕获插入片段的起点和终点,统计插入片段的长度。本发明方法保留了更多短片段的数据,以及准确定位插入片段的起点和终点,准确剔除测序数据中的外源序列,该方法可以有效提高血浆中检测到的短片段ctDNA含量,有助于二代测序数据在液体活检中的高效应用。

    一种二代测序平台的基因组数据高效利用方法和装置

    公开(公告)号:CN111445956A

    公开(公告)日:2020-07-24

    申请号:CN202010328112.5

    申请日:2020-04-23

    IPC分类号: G16B30/10

    摘要: 本发明公开了一种二代测序平台的基因组数据高效利用方法和装置,其中,所述方法包括:(1)对二代测序原始数据进行质控,质控中保留中部或尾部包含接头序列的读对;(2)质控达标的数据与参考基因组进行比对后,获得全长比对、部分比对以及未比对上三种比对情况;(3)针对三种比对情况,分别捕获插入片段的起点和终点,统计插入片段的长度。本发明方法保留了更多短片段的数据,以及准确定位插入片段的起点和终点,准确剔除测序数据中的外源序列,该方法可以有效提高血浆中检测到的短片段ctDNA含量,有助于二代测序数据在在液体活检中的高效应用。

    基于二代测序的石蜡切片样本体细胞突变检测方法和装置

    公开(公告)号:CN110729025B

    公开(公告)日:2020-05-08

    申请号:CN201911297543.3

    申请日:2019-12-17

    摘要: 本发明涉及二代测序分析领域的基于二代测序的石蜡切片样本体细胞突变检测方法和装置。该方法包括:获取新鲜肿瘤冷冻组织样本体细胞突变和肿瘤组织石蜡切片样本体细胞突变最高一致性时的过滤参数作为过滤阈值;检测待测肿瘤组织石蜡切片样本的体细胞突变;过滤与正常样本变异位点集重合的位点;过滤未达到所述过滤阈值的体细胞突变位点;过滤生殖细胞突变和高频突变位点。本发明以PON、以基于石蜡切片组织特征的特异性训练体细胞突变位点过滤阈值以及以已有数据库过滤生殖细胞突变和高频突变位点作为体细胞突变检测的过滤条件,能够快速剔除大部分由石蜡切片制备造成的假阳性结果,提高检测效率和特异性,快速精准检测石蜡切片体细胞突变。

    基于二代测序的石蜡切片样本体细胞突变检测方法和装置

    公开(公告)号:CN110729025A

    公开(公告)日:2020-01-24

    申请号:CN201911297543.3

    申请日:2019-12-17

    摘要: 本发明涉及二代测序分析领域的基于二代测序的石蜡切片样本体细胞突变检测方法和装置。该方法包括:获取新鲜肿瘤冷冻组织样本体细胞突变和肿瘤组织石蜡切片样本体细胞突变最高一致性时的过滤参数作为过滤阈值;检测待测肿瘤组织石蜡切片样本的体细胞突变;过滤与正常样本变异位点集重合的位点;过滤未达到所述过滤阈值的体细胞突变位点;过滤生殖细胞突变和高频突变位点。本发明以PON、以基于石蜡切片组织特征的特异性训练体细胞突变位点过滤阈值以及以已有数据库过滤生殖细胞突变和高频突变位点作为体细胞突变检测的过滤条件,能够快速剔除大部分由石蜡切片制备造成的假阳性结果,提高检测效率和特异性,快速精准检测石蜡切片体细胞突变。

    预测肿瘤组织cfDNA的方法及系统

    公开(公告)号:CN112086129A

    公开(公告)日:2020-12-15

    申请号:CN202011009109.3

    申请日:2020-09-23

    IPC分类号: G16B30/00

    摘要: 一种预测肿瘤组织cfDNA的方法及系统,该方法包括:待测样本特征提取步骤,包括提取待测样本的cfDNA测序数据的末端特征和Kmer频数特征;预测步骤,包括通过模型,对所述待测样本的cfDNA测序数据的末端特征和Kmer频数特征进行分析,根据分析结果,预测所述待测样本是否为健康样本或肿瘤样本。通过提取末端特征和Kmer频数特征,构建模型,显著提高肿瘤组织cfDNA预测的特异性和灵敏度。

    一种基于测序数据识别染色质开放区域的方法及装置

    公开(公告)号:CN111724860A

    公开(公告)日:2020-09-29

    申请号:CN202010561435.9

    申请日:2020-06-18

    IPC分类号: G16B30/00

    摘要: 本申请公开了一种基于测序数据识别染色质开放区域的方法及装置。本申请方法包括,测序数据处理步骤,根据cfDNA全基因组测序数据在参考基因组的位置,计算窗口化保护评分和测序深度;初步筛选步骤,定位WPS的波峰和波谷,将相邻波峰的间距大于阈值的区域作为候选染色质开放区域;波峰参数筛选步骤,根据候选染色质开放区域两侧各3-9个WPS的波峰面积、波峰夹角,波峰间距、波峰高度和波峰宽度进一步筛选;染色质开放区域识别步骤,通过cfDNA平均标准化测序深度验证,准确识别染色质开放区域。本申请方法,无需借助参考图谱,不依赖任何试剂或试验,仅通过数据分析即可简单、有效的获得染色质开放区域,提高了检测质量和效率。

    单样本全基因组预测等位基因特异性拷贝数变异的方法

    公开(公告)号:CN112802548B

    公开(公告)日:2021-10-22

    申请号:CN202110020493.5

    申请日:2021-01-07

    摘要: 一种单样本全基因组预测等位基因特异性拷贝数变异的方法,该方法包括:分析比对到参考基因组的待测样本的测序数据,提取肿瘤纯度信息、全基因组复制信息和总拷贝数变异信息,然后根据染色体每个区段的总拷贝数变异信息进行分类处理,将总拷贝数变异信息转换成等位基因特异性拷贝数变异信息,如果染色体区段的总拷贝数变异信息为奇数区间或0区间,则直接推算出等位基因特异性拷贝数变异信息,如果染色体区段的总拷贝数变异信息为非0偶数区间,则通过模型预测得到该区间的等位基因特异性拷贝数变异信息。本发明只需要单样本,无需配对的正常样本,所需待测样本的测序深度低,检测准确度高,可检测低肿瘤纯度样本的同源重组缺陷。