一种鉴定肿瘤纯度样本的模型构建方法及应用

    公开(公告)号:CN110808081A

    公开(公告)日:2020-02-18

    申请号:CN201910933916.5

    申请日:2019-09-29

    IPC分类号: G16B5/00 G16B20/20

    摘要: 本发明属于肿瘤纯度检测领域,具体涉及一种鉴定肿瘤纯度样本的模型构建方法及应用,包括:基于已知肿瘤纯度肿瘤样本的靶向捕获测序数据,获取包括如下的指标数据:体细胞拷贝数变化幅度、杂合子种系单核苷酸变异和体细胞等位基因变异分数;将上述指标数据与已知纯度肿瘤样本的肿瘤纯度进行关联构建鉴定模型;上述方法中,结合体细胞突变和生殖细胞变异,综合体细胞拷贝数变化幅度、杂合子种系单核苷酸变异和体细胞等位基因变异分数等指标数据构建的模型,解决了区间芯片捕获测序如panel测序突变位点少肿瘤纯度鉴定困难的问题,可以比较准确地识别出低纯度样本,实现各个不同指标之间多重相互交叉确认,可信度较高。

    一种石蜡切片组织RNA分析方法
    22.
    发明公开

    公开(公告)号:CN110684830A

    公开(公告)日:2020-01-14

    申请号:CN201910962113.2

    申请日:2019-10-11

    摘要: 本发明提供了一种石蜡切片组织RNA分析方法,所述分析方法包括以下步骤:对石蜡切片组织进行DNA降解,提取样本RNA;制备石蜡切片样本核酸文库,并对样本RNA进行测序;对测序得到的样本数据进行质控;将质控后的样本数据与参考基因组进行比对,并对比对结果进行质控;再对比对结果质控后的样本数据进行转录组组装和转录本定量,对基因表达进行定量分析、基因差异表达分析以及融合基因分析。本发明提供了一种完整地评估石蜡切片组织RNA质量的指标及检测方法,能够对石蜡切片组织RNA进行综合评估,评估结果准确有效,为后续分析的准确性提供了有效的参考依据。

    一种检测样本污染率的方法及装置

    公开(公告)号:CN115083529A

    公开(公告)日:2022-09-20

    申请号:CN202210811098.3

    申请日:2022-07-11

    IPC分类号: G16B50/30 G16B20/30

    摘要: 一种检测样本污染率的方法及装置,该方法包括:位点MAF提取步骤,包括提取待测样本的测序数据中的位点在数据库中的MAF;过滤步骤,包括过滤去除不符合条件的SNP位点;错误率计算步骤,包括计算不同碱基替换的错误率;似然值计算步骤,包括计算待测样本在不同污染率下的似然值;候选污染率计算步骤,包括根据每个SNP位点计算的似然值对数与位点深度计算加权平均值,选择加权平均值最大的似然值对应的污染率为候选污染率;优化步骤,包括根据优化函数优化候选污染率,获得最终的样本污染率。该方法的分析结果可信度高。

    一种mNGS鉴定微生物的数据处理方法、装置及存储介质

    公开(公告)号:CN114242173A

    公开(公告)日:2022-03-25

    申请号:CN202111579973.1

    申请日:2021-12-22

    IPC分类号: G16B50/00 G16B30/10

    摘要: 本申请公开了一种mNGS鉴定微生物的数据处理方法、装置及存储介质。本申请的数据处理方法包括,利用Linux系统提供的内存映射/dev/shm加载数据库;在读取数据库之前,先检查数据库大小,如小于硬盘中原始加载的数据库大小,则通过虚拟内存触碰方式将其激活,使得加载数据库完整的缓存于内存中;采用内存映射方式加载参考基因组;采用Linux管道输出和读入,减少临时文件,提高分析速度。本申请方法,通过对数据处理过程中限制速度的关键步骤进行优化,提高了mNGS鉴定微生物的速度和效率,降低了对高性能硬件设备的依赖性,使得mNGS鉴定微生物仅采用现有常规的硬件设备就能实现快速、高效、准确的微生物分析和鉴定。

    基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置

    公开(公告)号:CN111755068A

    公开(公告)日:2020-10-09

    申请号:CN202010567812.X

    申请日:2020-06-19

    IPC分类号: G16B20/20 G16B20/30 G16B30/00

    摘要: 本申请公开了一种基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置。本申请方法包括,将质控后的下机数据比对到参考基因组上,并进行变异检测和人群数据库注释,使用纯度预测软件对肿瘤和正常样本预处理好的数据进行试验,获得纯度和拷贝数信息模型;对于符合正常分布的模型,进一步筛选出高肿瘤细胞分数亚克隆区域探针支持数最多的模型,并结合BAF与allele1和allele2拷贝数的匹配率定义最优模型。本申请的方法,快速高效的校正了纯度检测软件的模型,能更准确的得到肿瘤的纯度和绝对拷贝数信息;保障准确性的同时,避免了人工校验的繁琐过程,节省了人工成本,为后续肿瘤基因组进化以及肿瘤内异质性研究奠定了基础。