- 专利标题: 用于大数据电子病历约简的多粒度属性权重Spark方法
-
申请号: CN201810642497.5申请日: 2018-06-21
-
公开(公告)号: CN108986872B公开(公告)日: 2021-05-07
- 发明人: 丁卫平 , 陆琰 , 管致锦 , 程学云 , 王杰华 , 董建成 , 李跃华 , 张晓峰 , 胡彬 , 陈森博 , 沈学华
- 申请人: 南通大学
- 申请人地址: 江苏省南通市崇川区啬园路8号
- 专利权人: 南通大学
- 当前专利权人: 南通大学
- 当前专利权人地址: 江苏省南通市崇川区啬园路8号
- 代理机构: 南京正联知识产权代理有限公司
- 代理商 吴惠松
- 主分类号: G16H10/60
- IPC分类号: G16H10/60 ; G16H50/70
摘要:
本发明公开了一种用于大数据电子病历约简的多粒度属性权重Spark方法。该方法首先在Hadoop分布式文件系统中将大数据电子病历集划分成不同的条件属性作业和决策属性作业;然后设计基于改进MapReduce作业协同结构的Spark模型,将电子病历条件属性作业并行化处理;其次在Hadoop分布式文件系统中构建多粒度属性权重Spark方法用于电子病历属性快速约简,从而求得大数据电子病历属性约简最优特征集;最后将大数据电子病历属性约简特征集R1,R2,…,Rn存储至Hadoop分布文件系统中,为相关疾病的临床诊断和治疗提供重要的智能诊断知识依据。
公开/授权文献
- CN108986872A 用于大数据电子病历约简的多粒度属性权重Spark方法 公开/授权日:2018-12-11