高通量测序数据的质控方法、装置、设备和存储介质

    公开(公告)号:CN116955735A

    公开(公告)日:2023-10-27

    申请号:CN202311098506.6

    申请日:2023-08-29

    摘要: 本申请涉及一种高通量测序数据的质控方法、装置、设备及存储介质。高通量测序数据的质控方法包括:获取一个批次的原始样本集中各样本的样本污染信息;在筛选原始样本集中是否存在异常样本的过程中,至少根据样本污染信息,从原始样本集中筛选出样本污染信息满足第四预设条件的异常样本,获得异常样本集;第四预设条件根据样本污染程度预设范围确定;若异常样本集中异常样本的数量超过数量阈值,则生成预警提示信号并输出,以及生成包含异常样本集中异常样本的信息的数据质控报告。本申请实施例建立了多个阶段、多维度的基因组数据质控管理体系,特别适合应用于临床遗传病高通量测序数据的规范化数据质控流。

    短串联重复的分析方法、装置、设备及存储介质

    公开(公告)号:CN117373531A

    公开(公告)日:2024-01-09

    申请号:CN202311397900.X

    申请日:2023-10-26

    IPC分类号: G16B20/30 G16B30/00

    摘要: 本申请涉及一种短串联重复的分析方法、装置、设备及存储介质。短串联重复的分析方法包括:根据待测样本的外显子组测序数据分析得到的短串联重复区域确定预设相关基因的重复次数数据的置信度并获得第一预设分值;根据短串联重复区域内预设相关基因的重复次数数据确定第二预设分值;根据短串联重复区域中两条等位基因的覆盖程度获得第三预设分值;根据待测样本的转录组测序数据分析得到的预设相关基因中与预设疾病相关的富集程度确定第四预设分值;根据第一预设分值、第二预设分值、第三预设分值和第四预设分值,确定短串联重复的类型。本申请实施例具有准确度高的优点。