一种用于精神分裂症病历图像特征选择的稀疏双向Spark方法
摘要:
本发明提供了一种用于精神分裂症病历图像特征选择的稀疏双向Spark方法,属于精神分裂症的生物标记物选择技术领域;解决了数据集中样本分布不一致的技术问题。其技术方案为:首先,在主节点Master上,读取大规模精神分裂症病历图像数据,对其进行预处理和划分,并将数据子集广播到相应的子节点上,在第i子节点Slaveri上,通过Spark并行化的稀疏约束模型刻画样本之间的联系,得到样本最优的K个邻居(K是邻居个数),然后,在粒化过程中引入双向互邻策略,构造基于稀疏双向的Spark粗糙集模型,在子节点Slaveri上,将启发式特征选择方法和动态优化策略结合,选取预测精神分裂症的重要脑区域。本发明的有益效果为:有助于精神分裂症的预测。
0/0