用于大数据电子病历约简的多粒度属性权重Spark方法

发明授权

CN108986872B 用于大数据电子病历约简的多粒度属性权重Spark方法有权

请登陆查看更多内容

专利标题： 用于大数据电子病历约简的多粒度属性权重Spark方法
申请号： CN201810642497.5

申请日： 2018-06-21
公开(公告)号： CN108986872B

公开(公告)日： 2021-05-07
发明人: 丁卫平 , 陆琰 , 管致锦 , 程学云 , 王杰华 , 董建成 , 李跃华 , 张晓峰 , 胡彬 , 陈森博 , 沈学华
申请人： 南通大学
申请人地址： 江苏省南通市崇川区啬园路8号
专利权人： 南通大学
当前专利权人： 南通大学
当前专利权人地址： 江苏省南通市崇川区啬园路8号
代理机构： 南京正联知识产权代理有限公司
代理商 吴惠松
主分类号： G16H10/60
IPC分类号： G16H10/60 ; G16H50/70

摘要：

本发明公开了一种用于大数据电子病历约简的多粒度属性权重Spark方法。该方法首先在Hadoop分布式文件系统中将大数据电子病历集划分成不同的条件属性作业和决策属性作业；然后设计基于改进MapReduce作业协同结构的Spark模型，将电子病历条件属性作业并行化处理；其次在Hadoop分布式文件系统中构建多粒度属性权重Spark方法用于电子病历属性快速约简，从而求得大数据电子病历属性约简最优特征集；最后将大数据电子病历属性约简特征集R1,R2,…,Rn存储至Hadoop分布文件系统中，为相关疾病的临床诊断和治疗提供重要的智能诊断知识依据。

公开/授权文献

CN108986872A 用于大数据电子病历约简的多粒度属性权重Spark方法公开/授权日：2018-12-11

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G16	特别适用于特定应用领域的信息通信技术
G16H	医疗保健信息学，即专门用于处置或处理医疗或健康数据的信息和通信技术[ICT]
G16H10/00	专门用于加工或处理患者相关医疗或保健数据的ICT（医疗报告入G16H15/00；治疗或健康改善计划入G16H 20/00；用于处理或加工医疗图像入G16H 30/00）
G16H10/60	.患者特定数据，例如电子病历记录