大规模肝脏电子病历病变分类的属性并行约简Spark方法

    公开(公告)号:CN111816270B

    公开(公告)日:2022-12-09

    申请号:CN202010558462.0

    申请日:2020-06-18

    申请人: 南通大学

    摘要: 本发明提供了大规模肝脏电子病历病变分类的属性并行约简Spark方法,包括如下步骤:S10读取肝脏电子病历的数据集合并划分成多个肝脏病历数据子集发送到相应从节点上;S20对所述肝脏病历数据子集进行不一致处理,约简肝脏病历数据中不一致的数据,然后计算肝脏病历数据属性的等价类划分值;S30根据肝脏病历数据子集中数据对象计算属性重要度;S40计算出所述从节点中肝脏病历数据子集的属性重要度集合,进行聚合操作,得到肝脏病历数据的属性重要度集合;S50计算肝脏病历数据集的属性约简集合,并判断其是否满足约简要求。本发明的大规模肝脏电子病历病变分类的属性并行约简Spark方法,有效提高大规模肝脏电子病历属性并行约简的效率和精度。

    用于大数据电子病历约简的多粒度属性权重Spark方法

    公开(公告)号:CN108986872B

    公开(公告)日:2021-05-07

    申请号:CN201810642497.5

    申请日:2018-06-21

    申请人: 南通大学

    IPC分类号: G16H10/60 G16H50/70

    摘要: 本发明公开了一种用于大数据电子病历约简的多粒度属性权重Spark方法。该方法首先在Hadoop分布式文件系统中将大数据电子病历集划分成不同的条件属性作业和决策属性作业;然后设计基于改进MapReduce作业协同结构的Spark模型,将电子病历条件属性作业并行化处理;其次在Hadoop分布式文件系统中构建多粒度属性权重Spark方法用于电子病历属性快速约简,从而求得大数据电子病历属性约简最优特征集;最后将大数据电子病历属性约简特征集R1,R2,…,Rn存储至Hadoop分布文件系统中,为相关疾病的临床诊断和治疗提供重要的智能诊断知识依据。

    大规模肝脏电子病历病变分类的属性并行约简Spark方法

    公开(公告)号:CN111816270A

    公开(公告)日:2020-10-23

    申请号:CN202010558462.0

    申请日:2020-06-18

    申请人: 南通大学

    摘要: 本发明提供了大规模肝脏电子病历病变分类的属性并行约简Spark方法,包括如下步骤:S10读取肝脏电子病历的数据集合并划分成多个肝脏病历数据子集发送到相应从节点上;S20对所述肝脏病历数据子集进行不一致处理,约简肝脏病历数据中不一致的数据,然后计算肝脏病历数据属性的等价类划分值;S30根据肝脏病历数据子集中数据对象计算属性重要度;S40计算出所述从节点中肝脏病历数据子集的属性重要度集合,进行聚合操作,得到肝脏病历数据的属性重要度集合;S50计算肝脏病历数据集的属性约简集合,并判断其是否满足约简要求。本发明的大规模肝脏电子病历病变分类的属性并行约简Spark方法,有效提高大规模肝脏电子病历属性并行约简的效率和精度。

    用于大数据电子病历约简的多粒度属性权重Spark方法

    公开(公告)号:CN108986872A

    公开(公告)日:2018-12-11

    申请号:CN201810642497.5

    申请日:2018-06-21

    申请人: 南通大学

    IPC分类号: G16H10/60 G16H50/70

    摘要: 本发明公开了一种用于大数据电子病历约简的多粒度属性权重Spark方法。该方法首先在Hadoop分布式文件系统中将大数据电子病历集划分成不同的条件属性作业和决策属性作业;然后设计基于改进MapReduce作业协同结构的Spark模型,将电子病历条件属性作业并行化处理;其次在Hadoop分布式文件系统中构建多粒度属性权重Spark方法用于电子病历属性快速约简,从而求得大数据电子病历属性约简最优特征集;最后将大数据电子病历属性约简特征集R1,R2,…,Rn存储至Hadoop分布文件系统中,为相关疾病的临床诊断和治疗提供重要的智能诊断知识依据。

    一种用于异常脑组织病历分类的自适应分层邻域半径方法

    公开(公告)号:CN106023030A

    公开(公告)日:2016-10-12

    申请号:CN201610320142.5

    申请日:2016-05-13

    申请人: 南通大学

    IPC分类号: G06Q50/24

    CPC分类号: G06Q50/24

    摘要: 本发明公开了一种用于异常脑组织病历分类的自适应分层邻域半径方法,包括以下步骤:首先构造基于自适应邻域半径的四层结构分割框架,将每一层对应一个邻域半径有效解,通过迭代计算自适应调整邻域半径;然后通过对异常脑组织病历进行同层内邻域半径交互和不同层间邻域半径级联操作。本发明能有效提取异常脑组织病历内部不同区域属性特征,提高脑组织不同纵向皮质表面标签的分类效率,对异常脑部疾病早期预防、延缓脑疾病发作等具有较好的作用。

    一种用于MRI病历属性约简的量子协同博弈实现方法

    公开(公告)号:CN103838972B

    公开(公告)日:2016-08-24

    申请号:CN201410090633.6

    申请日:2014-03-13

    申请人: 南通大学

    IPC分类号: G06F19/00 G06N3/00

    摘要: 本发明公开了一种用于MRI病历属性约简的量子协同博弈实现方法,首先初始化进化种群,将MRI病历属性通过竞争协同自适应划分到不同的进化子种群中,并在各进化子种群中进行各自优秀种群精英选取;其次在MRI属性约简时将信任裕度报酬机制引入到种群精英量子协同博弈模型中,构建种群精英信任裕度效用矩阵;再次各种群精英在每个划分的MRI病历属性子集中通过量子协同博弈策略求得各自最优约简子集,从而稳定取得Nash均衡下MRI病历全局最优属性约简集;最后进行MRI属性约简性能评估,判断其属性约简精度是否满足要求。本发明能较好地克服MRI病历中存在着噪音和灰度不均匀性,具有较高的MRI病历属性约简效率、准确性和稳定性。

    Web环境下基于池技术的环保物联网实时控制方法

    公开(公告)号:CN104079658A

    公开(公告)日:2014-10-01

    申请号:CN201410331300.8

    申请日:2014-07-14

    申请人: 南通大学

    IPC分类号: H04L29/08

    摘要: 本发明公开了一种Web环境下基于池技术的环保物联网实时控制方法,适用于B/S架构的污染源实时监控系统,所涉及的池包括:存储监控终端、浏览器等Socket连接信息的连接池,存储浏览器端向远程目标设备发出控制请求的执行中控制池和等待控制池,以及存储各类数据的数据池,所述的环保物联网实时控制方法,利用池技术实现了浏览器端对远程设备的并发控制,并能将无来源标识的控制结果准确地返回给发起控制的浏览器。

    一种用于微血管瘤病历图像的超平面近邻分类方法

    公开(公告)号:CN111242156B

    公开(公告)日:2022-02-08

    申请号:CN201911104118.8

    申请日:2019-11-13

    申请人: 南通大学

    摘要: 本发明公开一种用于微血管瘤病历图像的超平面近邻分类方法。该方法首先对糖尿病性眼底图像数据进行预处理和分割操作,从处理后的眼底病历图像中提取出微血管瘤病历图像的病变区域;接着将微血管瘤病变的图像区域形态学特征、纹理特征及灰度特征转化为l维数据向量xi;然后将数据分为训练数据Xtr和测试数据Xte,通过对训练数据Xtr进行训练得到一个包括分类超平面Hyper、支持向量集合Xsv、距离阈值t、最近邻居个数k、和谱哈希编码码长nb的高效分类模型;最后测试数据Xte预测时依据测试样本到分类超平面Hyper的距离与距离阈值t的关系,分别采用支持向量机模型和融合谱哈希算法的近邻算法进行预测,并综合相关预测结果。本发明能对提取出的眼底病历中微血管瘤病历图像特征进行快速有效分类,具有较高的分类准确率,大大降低了微血管瘤病历图像特征分类的执行时间。