一种检测串联重复区域的方法、装置、设备及存储介质

    公开(公告)号:CN116206680A

    公开(公告)日:2023-06-02

    申请号:CN202310204987.8

    申请日:2023-03-06

    申请人: 聊城大学

    摘要: 一种检测串联重复区域的方法、装置、设备及储存介质,其方法包括:从缺失值和N位置处理后的基因组序列中提取读对深度和映射质量;校正GC偏差处理所述读对深度后,与所述映射质量经平滑去噪处理和标准化处理;经分类处理后得到异常点,筛选所述异常点,得到粗糙的串联重复区域;所述粗糙的串联重复区域经分裂读对方法和成对末端映射方法处理,得到细化的串联重复区域。该方法能够消除由于测序误差、映射误差和GC含量偏差等噪声造成的影响,使读对深度和映射质量分布均衡;且能够在低覆盖度和低肿瘤纯度情况下,将串联重复区域做进一步细化,从而获得更高准确度的串联重复区域。

    一种拷贝数变异检测方法、装置、设备和计算机可读介质

    公开(公告)号:CN115331731A

    公开(公告)日:2022-11-11

    申请号:CN202211000615.5

    申请日:2022-08-19

    申请人: 聊城大学

    IPC分类号: G16B20/10 G16B40/00 G16B30/10

    摘要: 本发明公开了一种拷贝数变异检测方法、装置、设备和计算机可读介质,属于基因工程技术领域。所述方法包括:将基因组划分为基因组箱,生成基因组的信息配置文件,信息配置文件包括:各基因组箱的读深信号和比对质量;根据信息配置文件对基因组进行全局分割,并对全局分割后的至少部分基因组进行局部分割,获得基因片段以及基因片段的读深信号和比对质量;将基因片段的读深信号和比对质量作为分类特征,计算基因片段的异常分数,识别基因组的拷贝数变异区域。本发明实施例公开的检测方法可提高拷贝数变异检测的敏感性,在检测低幅度拷贝数变异方面有效、可靠。