一种二代测序数据分析平台的数据处理方法
摘要:
本发明一种二代测序数据分析平台的数据处理方法,其中二代测序数据分析平台IMP将整个二代测序NGS处理流程实现为从输入FASTQ文件格式的短读长序列到输出标准VCF文件格式的变异检测的单个步骤,同时,还提供以标准SAM或BAM格式输出序列比对中间结果的选项,通过大量的内存访问、而不是使用缓慢的I/O来交换数据,可避免较慢的硬盘和SSD的I/O访问所需的数据搜索和加载时间,使哈希表写入或读出、删除重复比对记录,以及变异检测都更为迅速,在不影响分析质量的前提下,能实现快速的二代测序NGS数据分析,与现有方案相比速度提升达20倍。
公开/授权文献
0/0