一种测序数据GC偏向性校正的方法及其装置

    公开(公告)号:CN111627498B

    公开(公告)日:2022-10-04

    申请号:CN202010436420.X

    申请日:2020-05-21

    IPC分类号: G16B20/30 G16B30/10 G16B40/00

    摘要: 一种测序数据GC偏向性校正的方法,包括如下步骤:获取基因组的测序数据比对数据可供计算分析区间R;从可供计算分析区间R中获取最高频率片段长度数F;通过对区间R进行不重复的抽样,抽样数N小于或等于区间R的总长度;计算每一个抽出的位置P对应的如下A)‑B)的参数:A)位置P到位置P+F之间的序列中的G碱基和C碱基的个数之和Gp;B)位置P上比对片段数Fp,所述比对片段的起始位置为位置P;汇总每一个位置上述的数值,对每一个Gp值进行分层统计,最终计算每一个Gp值对应的GC片段比例;将测序深度除以Rgc进行测序深度计算修正。本发明的GC偏向性校正方法构建的模型,修正效果好。

    一种检测RNA跨样本交叉污染率的方法和装置

    公开(公告)号:CN111370065B

    公开(公告)日:2022-10-04

    申请号:CN202010224358.8

    申请日:2020-03-26

    IPC分类号: G16B30/10

    摘要: 本发明公开了一种检测RNA跨样本交叉污染率的方法和装置,其中,方法包括:获得待检测样本的测序数据与参考基因组之间的比对结果文件;从比对结果文件中筛选出覆盖多态性位点且表达量不低于设定阈值的持家基因蛋白质编码区域作为信息提取区间;利用信息提取区间、比对结果文件和遗传多态性位点信息数据库计算样本污染率。本发明通过筛选稳定表达的多态性位点作为污染率计算软件的输入,改进了该软件只能用于DNA污染率评估的不足,程序操作方便,分析速度快,自动化程度高,与标准品对比,分析结果可信度高,实现对RNA样本的质量评估,有助于后续分析的准确性。

    一种同源重组修复缺陷的评估方法、装置和存储介质

    公开(公告)号:CN114242170A

    公开(公告)日:2022-03-25

    申请号:CN202111572513.6

    申请日:2021-12-21

    摘要: 本申请公开了一种同源重组修复缺陷的评估方法、装置和存储介质。本申请方法包括,获取待测样本低深度全基因组测序数据,去接头,比对到参考基因组上,过滤PCR重复序列;对数据进行质控和污染数据过滤,然后用ACE软件进行CNV分析,获得total CNA谱;根据total CNA谱计算LST值,并采用WGD情况校正LST值;根据BRCA基因型别和校正LST值判断HRD为阳性或阴性。本申请方法利用低深度全基因组测序数据进行LST值计算,并采用WGD情况校正LST值;无需LOH和TAI等其他基因组瘢痕标志物,可直接用校正LST值进行HRD状态评估,提高了PARP抑制剂治疗预测及预后的有效性和准确性。

    一种预测MET基因拷贝数变化类型的方法及装置

    公开(公告)号:CN112768000A

    公开(公告)日:2021-05-07

    申请号:CN202110099257.7

    申请日:2021-01-25

    IPC分类号: G16B20/20

    摘要: 一种预测MET基因拷贝数变化类型的方法及装置,该方法包括:基因拷贝数比值分析步骤,根据基线,分析基因拷贝数的比值;捕获区域分析步骤,根据比值,对待测样本的捕获区域进行拷贝数变异注释,根据注释的结果,预测待测样本中MET基因拷贝数是否发生变化;MET基因拷贝数变化类型预测步骤,对于预测结果为MET基因拷贝数增加的待测样本,获取基因拷贝数比值,统计基因拷贝数比值是否存在显著性差异,预测得到MET基因拷贝数增加的类型。以相同时间点的正常对照样本建立基线,避免待测样本分析CNV的结果存在偏差,显著提高MET基因拷贝数变化类型预测的灵敏度和特异度。

    基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置

    公开(公告)号:CN111755068B

    公开(公告)日:2021-02-19

    申请号:CN202010567812.X

    申请日:2020-06-19

    IPC分类号: G16B20/20 G16B20/30 G16B30/00

    摘要: 本申请公开了一种基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置。本申请方法包括,将质控后的下机数据比对到参考基因组上,并进行变异检测和人群数据库注释,使用纯度预测软件对肿瘤和正常样本预处理好的数据进行试验,获得纯度和拷贝数信息模型;对于符合正常分布的模型,进一步筛选出高肿瘤细胞分数亚克隆区域探针支持数最多的模型,并结合BAF与allele1和allele2拷贝数的匹配率定义最优模型。本申请的方法,快速高效的校正了纯度检测软件的模型,能更准确的得到肿瘤的纯度和绝对拷贝数信息;保障准确性的同时,避免了人工校验的繁琐过程,节省了人工成本,为后续肿瘤基因组进化以及肿瘤内异质性研究奠定了基础。

    一种测序数据GC偏向性校正的方法及其装置

    公开(公告)号:CN111627498A

    公开(公告)日:2020-09-04

    申请号:CN202010436420.X

    申请日:2020-05-21

    IPC分类号: G16B20/30 G16B30/10 G16B40/00

    摘要: 一种测序数据GC偏向性校正的方法,包括如下步骤:获取基因组的测序数据比对数据可供计算分析区间R;从可供计算分析区间R中获取最高频率片段长度数F;通过对区间R进行不重复的抽样,抽样数N小于或等于区间R的总长度;计算每一个抽出的位置P对应的如下A)-B)的参数:A)位置P到位置P+F之间的序列中的G碱基和C碱基的个数之和Gp;B)位置P上比对片段数Fp,所述比对片段的起始位置为位置P;汇总每一个位置上述的数值,对每一个Gp值进行分层统计,最终计算每一个Gp值对应的GC片段比例;将测序深度除以Rgc进行测序深度计算修正。本发明的GC偏向性校正方法构建的模型,修正效果好。