基于高通量染色体构象捕获的超大染色体组装方法及应用

    公开(公告)号:CN118522353B

    公开(公告)日:2024-11-01

    申请号:CN202410969593.6

    申请日:2024-07-19

    发明人: 蔡晶 曾鹏 曾一凡

    摘要: 本发明公开了一种基于高通量染色体构象捕获的超大染色体组装方法及应用,涉及生物信息学和生物技术领域。所述方法包括将待组装测序数据通过Hi‑C文库比对到contig版本的基因组,并对contig错误片段进行打断,然后进行第一轮组装;对每个bins进行第二轮组装;将所有bins中的scaffolds合并后进行第三轮组装;分别对每条染色体进行第四轮组装,并对每条染色体中contigs再次调整,得到各个染色体的挂载结果。本发明通过染色体分段进行Juicebox手动调整,解决了针对超大或contig数目过万基因组遇到的Juicebox程序冻结/卡顿问题。

    基于高通量染色体构象捕获的超大染色体组装方法及应用

    公开(公告)号:CN118522353A

    公开(公告)日:2024-08-20

    申请号:CN202410969593.6

    申请日:2024-07-19

    发明人: 蔡晶 曾鹏 曾一凡

    摘要: 本发明公开了一种基于高通量染色体构象捕获的超大染色体组装方法及应用,涉及生物信息学和生物技术领域。所述方法包括将待组装测序数据通过Hi‑C文库比对到contig版本的基因组,并对contig错误片段进行打断,然后进行第一轮组装;对每个bins进行第二轮组装;将所有bins中的scaffolds合并后进行第三轮组装;分别对每条染色体进行第四轮组装,并对每条染色体中contigs再次调整,得到各个染色体的挂载结果。本发明通过染色体分段进行Juicebox手动调整,解决了针对超大或contig数目过万基因组遇到的Juicebox程序冻结/卡顿问题。