一种生物信息深度挖掘分析系统的架构构建方法

    公开(公告)号:CN112151114A

    公开(公告)日:2020-12-29

    申请号:CN202011124509.9

    申请日:2020-10-20

    IPC分类号: G16B20/20 G16B10/00 G06N20/00

    摘要: 本发明公开了一种生物信息深度挖掘分析系统的架构构建方法,包括如下步骤:S1:构建高通量计算一体化集群网络环境;S2:集成生物信息工具,形成生物信息挖掘分析方法调用库和生物信息挖掘分析流程模板;S3:基于PiFlow框架构建面向生物信息深度挖掘分析的图形化工作流模型;S4:基于Spark Streaming构建生物信息挖掘分析任务的调度和处理模型本发明具有提高多个挖掘分析工具之间的数据交换性能,降低挖掘分析过程的复杂程度,减少挖掘分析任务尤其是多个任务并发场景下的执行时间等优点。