一种检测RNA跨样本交叉污染率的方法和装置

    公开(公告)号:CN111370065B

    公开(公告)日:2022-10-04

    申请号:CN202010224358.8

    申请日:2020-03-26

    IPC分类号: G16B30/10

    摘要: 本发明公开了一种检测RNA跨样本交叉污染率的方法和装置,其中,方法包括:获得待检测样本的测序数据与参考基因组之间的比对结果文件;从比对结果文件中筛选出覆盖多态性位点且表达量不低于设定阈值的持家基因蛋白质编码区域作为信息提取区间;利用信息提取区间、比对结果文件和遗传多态性位点信息数据库计算样本污染率。本发明通过筛选稳定表达的多态性位点作为污染率计算软件的输入,改进了该软件只能用于DNA污染率评估的不足,程序操作方便,分析速度快,自动化程度高,与标准品对比,分析结果可信度高,实现对RNA样本的质量评估,有助于后续分析的准确性。

    一种同源重组修复缺陷的评估方法、装置和存储介质

    公开(公告)号:CN114242170A

    公开(公告)日:2022-03-25

    申请号:CN202111572513.6

    申请日:2021-12-21

    摘要: 本申请公开了一种同源重组修复缺陷的评估方法、装置和存储介质。本申请方法包括,获取待测样本低深度全基因组测序数据,去接头,比对到参考基因组上,过滤PCR重复序列;对数据进行质控和污染数据过滤,然后用ACE软件进行CNV分析,获得total CNA谱;根据total CNA谱计算LST值,并采用WGD情况校正LST值;根据BRCA基因型别和校正LST值判断HRD为阳性或阴性。本申请方法利用低深度全基因组测序数据进行LST值计算,并采用WGD情况校正LST值;无需LOH和TAI等其他基因组瘢痕标志物,可直接用校正LST值进行HRD状态评估,提高了PARP抑制剂治疗预测及预后的有效性和准确性。

    单样本全基因组预测等位基因特异性拷贝数变异的方法

    公开(公告)号:CN112802548B

    公开(公告)日:2021-10-22

    申请号:CN202110020493.5

    申请日:2021-01-07

    摘要: 一种单样本全基因组预测等位基因特异性拷贝数变异的方法,该方法包括:分析比对到参考基因组的待测样本的测序数据,提取肿瘤纯度信息、全基因组复制信息和总拷贝数变异信息,然后根据染色体每个区段的总拷贝数变异信息进行分类处理,将总拷贝数变异信息转换成等位基因特异性拷贝数变异信息,如果染色体区段的总拷贝数变异信息为奇数区间或0区间,则直接推算出等位基因特异性拷贝数变异信息,如果染色体区段的总拷贝数变异信息为非0偶数区间,则通过模型预测得到该区间的等位基因特异性拷贝数变异信息。本发明只需要单样本,无需配对的正常样本,所需待测样本的测序深度低,检测准确度高,可检测低肿瘤纯度样本的同源重组缺陷。

    单样本全基因组预测等位基因特异性拷贝数变异的方法

    公开(公告)号:CN112802548A

    公开(公告)日:2021-05-14

    申请号:CN202110020493.5

    申请日:2021-01-07

    摘要: 一种单样本全基因组预测等位基因特异性拷贝数变异的方法,该方法包括:分析比对到参考基因组的待测样本的测序数据,提取肿瘤纯度信息、全基因组复制信息和总拷贝数变异信息,然后根据染色体每个区段的总拷贝数变异信息进行分类处理,将总拷贝数变异信息转换成等位基因特异性拷贝数变异信息,如果染色体区段的总拷贝数变异信息为奇数区间或0区间,则直接推算出等位基因特异性拷贝数变异信息,如果染色体区段的总拷贝数变异信息为非0偶数区间,则通过模型预测得到该区间的等位基因特异性拷贝数变异信息。本发明只需要单样本,无需配对的正常样本,所需待测样本的测序深度低,检测准确度高,可检测低肿瘤纯度样本的同源重组缺陷。

    基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置

    公开(公告)号:CN111755068B

    公开(公告)日:2021-02-19

    申请号:CN202010567812.X

    申请日:2020-06-19

    IPC分类号: G16B20/20 G16B20/30 G16B30/00

    摘要: 本申请公开了一种基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置。本申请方法包括,将质控后的下机数据比对到参考基因组上,并进行变异检测和人群数据库注释,使用纯度预测软件对肿瘤和正常样本预处理好的数据进行试验,获得纯度和拷贝数信息模型;对于符合正常分布的模型,进一步筛选出高肿瘤细胞分数亚克隆区域探针支持数最多的模型,并结合BAF与allele1和allele2拷贝数的匹配率定义最优模型。本申请的方法,快速高效的校正了纯度检测软件的模型,能更准确的得到肿瘤的纯度和绝对拷贝数信息;保障准确性的同时,避免了人工校验的繁琐过程,节省了人工成本,为后续肿瘤基因组进化以及肿瘤内异质性研究奠定了基础。

    基于RNAseq数据的融合基因检测方法、装置和存储介质

    公开(公告)号:CN112164423A

    公开(公告)日:2021-01-01

    申请号:CN202011098214.9

    申请日:2020-10-14

    IPC分类号: G16B30/10 G16B40/00

    摘要: 本申请公开了一种基于RNAseq数据的融合基因检测方法、装置和存储介质。本申请方法包括,对原始下机数据进行质控,评估有效比对数据量、外显子比对率、污染率等情况;通过阳性和阴性标准品融合基因检出情况对比筛选融合基因检测软件;保留热点融合基因列表,过滤假阳性融合基因列表,针对标准品中假阳性融合检出情况设置支持读段过滤规则,降低假阳性检出比例;并针对基因内部分外显子缺失引起的融合突变进行软件开发和过滤规则制定。本申请方法综合数据质控评估、软件性能评估、过滤规则制定、外显子缺失分析等多种方案,既保证融合基因更全面地检出,又最大限度降低假阳性和假阴性比例,对临床用药指导和疾病诊断提供更全面精准的指导。

    一种测序数据GC偏向性校正的方法及其装置

    公开(公告)号:CN111627498A

    公开(公告)日:2020-09-04

    申请号:CN202010436420.X

    申请日:2020-05-21

    IPC分类号: G16B20/30 G16B30/10 G16B40/00

    摘要: 一种测序数据GC偏向性校正的方法,包括如下步骤:获取基因组的测序数据比对数据可供计算分析区间R;从可供计算分析区间R中获取最高频率片段长度数F;通过对区间R进行不重复的抽样,抽样数N小于或等于区间R的总长度;计算每一个抽出的位置P对应的如下A)-B)的参数:A)位置P到位置P+F之间的序列中的G碱基和C碱基的个数之和Gp;B)位置P上比对片段数Fp,所述比对片段的起始位置为位置P;汇总每一个位置上述的数值,对每一个Gp值进行分层统计,最终计算每一个Gp值对应的GC片段比例;将测序深度除以Rgc进行测序深度计算修正。本发明的GC偏向性校正方法构建的模型,修正效果好。