-
公开(公告)号:CN107609350A
公开(公告)日:2018-01-19
申请号:CN201710803991.0
申请日:2017-09-08
申请人: 厦门极元科技有限公司
摘要: 本发明一种二代测序数据分析平台的数据处理方法,其中二代测序数据分析平台IMP将整个二代测序NGS处理流程实现为从输入FASTQ文件格式的短读长序列到输出标准VCF文件格式的变异检测的单个步骤,同时,还提供以标准SAM或BAM格式输出序列比对中间结果的选项,通过大量的内存访问、而不是使用缓慢的I/O来交换数据,可避免较慢的硬盘和SSD的I/O访问所需的数据搜索和加载时间,使哈希表写入或读出、删除重复比对记录,以及变异检测都更为迅速,在不影响分析质量的前提下,能实现快速的二代测序NGS数据分析,与现有方案相比速度提升达20倍。
-
公开(公告)号:CN107609350B
公开(公告)日:2020-04-03
申请号:CN201710803991.0
申请日:2017-09-08
申请人: 厦门极元科技有限公司
摘要: 本发明一种二代测序数据分析平台的数据处理方法,其中二代测序数据分析平台IMP将整个二代测序NGS处理流程实现为从输入FASTQ文件格式的短读长序列到输出标准VCF文件格式的变异检测的单个步骤,同时,还提供以标准SAM或BAM格式输出序列比对中间结果的选项,通过大量的内存访问、而不是使用缓慢的I/O来交换数据,可避免较慢的硬盘和SSD的I/O访问所需的数据搜索和加载时间,使哈希表写入或读出、删除重复比对记录,以及变异检测都更为迅速,在不影响分析质量的前提下,能实现快速的二代测序NGS数据分析,与现有方案相比速度提升达20倍。
-
公开(公告)号:CN108197433A
公开(公告)日:2018-06-22
申请号:CN201711484262.X
申请日:2017-12-29
申请人: 厦门极元科技有限公司
摘要: 本发明公开一种快速DNA测序数据分析平台的数据内存和硬盘分流存储方法,包括:将序列比对数据分成索引数据和其他数据,将索引数据全部存放于计算机内存;对其他数据,按照一定的比例,以基因段为单位,分别放入计算机内存和和硬盘文件中。本发明降低了IMP算法分析海量基因测序数据时对计算机内存扩大的需求,同时降低了基因测序平台的搭建成本。
-
-