发明公开
- 专利标题: 一种生物信息深度挖掘分析系统的架构构建方法
-
申请号: CN202011124509.9申请日: 2020-10-20
-
公开(公告)号: CN112151114A公开(公告)日: 2020-12-29
- 发明人: 王婷 , 刘娟 , 崔运鹏 , 石运来 , 张晨 , 霍梦佳 , 赵艳博
- 申请人: 中国农业科学院农业信息研究所
- 申请人地址: 北京市海淀区中关村南大街12号
- 专利权人: 中国农业科学院农业信息研究所
- 当前专利权人: 中国农业科学院农业信息研究所
- 当前专利权人地址: 北京市海淀区中关村南大街12号
- 代理机构: 北京德崇智捷知识产权代理有限公司
- 代理商 申星宇
- 主分类号: G16B20/20
- IPC分类号: G16B20/20 ; G16B10/00 ; G06N20/00
摘要:
本发明公开了一种生物信息深度挖掘分析系统的架构构建方法,包括如下步骤:S1:构建高通量计算一体化集群网络环境;S2:集成生物信息工具,形成生物信息挖掘分析方法调用库和生物信息挖掘分析流程模板;S3:基于PiFlow框架构建面向生物信息深度挖掘分析的图形化工作流模型;S4:基于Spark Streaming构建生物信息挖掘分析任务的调度和处理模型本发明具有提高多个挖掘分析工具之间的数据交换性能,降低挖掘分析过程的复杂程度,减少挖掘分析任务尤其是多个任务并发场景下的执行时间等优点。