- 专利标题: 大规模肝脏电子病历病变分类的属性并行约简Spark方法
-
申请号: CN202010558462.0申请日: 2020-06-18
-
公开(公告)号: CN111816270B公开(公告)日: 2022-12-09
- 发明人: 丁卫平 , 李铭 , 孙颖 , 冯志豪 , 鞠恒荣 , 张毅 , 丁嘉陆 , 赵理莉 , 陈森博
- 申请人: 南通大学
- 申请人地址: 江苏省南通市啬园路9号
- 专利权人: 南通大学
- 当前专利权人: 南通大学
- 当前专利权人地址: 江苏省南通市啬园路9号
- 代理机构: 南京经纬专利商标代理有限公司
- 代理商 朱小兵
- 主分类号: G16H10/60
- IPC分类号: G16H10/60 ; G16H50/70 ; G06F16/35 ; G06F16/182
摘要:
本发明提供了大规模肝脏电子病历病变分类的属性并行约简Spark方法,包括如下步骤:S10读取肝脏电子病历的数据集合并划分成多个肝脏病历数据子集发送到相应从节点上;S20对所述肝脏病历数据子集进行不一致处理,约简肝脏病历数据中不一致的数据,然后计算肝脏病历数据属性的等价类划分值;S30根据肝脏病历数据子集中数据对象计算属性重要度;S40计算出所述从节点中肝脏病历数据子集的属性重要度集合,进行聚合操作,得到肝脏病历数据的属性重要度集合;S50计算肝脏病历数据集的属性约简集合,并判断其是否满足约简要求。本发明的大规模肝脏电子病历病变分类的属性并行约简Spark方法,有效提高大规模肝脏电子病历属性并行约简的效率和精度。
公开/授权文献
- CN111816270A 大规模肝脏电子病历病变分类的属性并行约简Spark方法 公开/授权日:2020-10-23