一种多源异构数据真值确定方法及装置
摘要:
本发明提供一种多源异构数据真值确定方法及装置,能够对异构冲突数据进行联合处理并提高真值发现的准确率。所述方法包括:S1,获取来自于不同数据源的异构冲突数据;S2,对描述同一对象的冲突数据,针对所有数据源的每一对象及所有对象,分别构建以最大化声明值可信性加权和为目标的目标函数G和优化模型F;S3,针对每一对象,采用基于穷举法的真值选择策略,更新所有数据源的权重;S4,根据更新后的所有数据源的权重,计算F值,根据得到的F值判断优化模型F是否收敛,若不收敛,返回S3继续执行;若收敛,则得到的所有对象的最优真值组成最优真值集。本发明涉及数据挖掘领域。
公开/授权文献
0/0