-
公开(公告)号:CN113963749A
公开(公告)日:2022-01-21
申请号:CN202111060995.7
申请日:2021-09-10
Applicant: 华南农业大学
Abstract: 本发明公开了一种高通量测序数据自动化组装方法、系统、设备及存储介质,所述方法包括:对于测序平台生成两个包含所有测序样本的reads的测序质量文件,读取两个测序质量文件中的每条reads,并输出到对应的测序文本,统计每个测序样本的reads数和无法识别的reads数后写入统计文件,完成测序样本的识别和分箱;对测序样本进行引物序列清除和表达载体序列清除。基于de Bruijn图算法对序列文件进行三次迭代组装,得到contig;基于重叠‑排列‑生成算法对contig进行两次迭代组装,从而获得基因组序列。本发明可以避免生物研究人员手动处理测序数据产生的误差,能够解决功能宏基因组学中高通量测序技术的测序数据处理效率低、操作易出错等问题。
-
公开(公告)号:CN113963749B
公开(公告)日:2024-07-12
申请号:CN202111060995.7
申请日:2021-09-10
Applicant: 华南农业大学
Abstract: 本发明公开了一种高通量测序数据自动化组装方法、系统、设备及存储介质,所述方法包括:对于测序平台生成两个包含所有测序样本的reads的测序质量文件,读取两个测序质量文件中的每条reads,并输出到对应的测序文本,统计每个测序样本的reads数和无法识别的reads数后写入统计文件,完成测序样本的识别和分箱;对测序样本进行引物序列清除和表达载体序列清除。基于de Bruijn图算法对序列文件进行三次迭代组装,得到contig;基于重叠‑排列‑生成算法对contig进行两次迭代组装,从而获得基因组序列。本发明可以避免生物研究人员手动处理测序数据产生的误差,能够解决功能宏基因组学中高通量测序技术的测序数据处理效率低、操作易出错等问题。
-