一种获取相似对象集合的方法和装置
摘要:
本发明公开了一种获取相似对象集合的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取目标对象集合、待相似对象集合;设置局部敏感对比步长r;采用局部敏感‑最小哈希值算法,根据目标对象对应的特征数据、待相似对象对应的特征数据、局部敏感对比步长r,从待相似对象集合中获取目标对象的相似对象集合。该实施方式采用局部敏感‑最小哈希值算法,从待相似对象集合中获取目标对象的相似对象集合,克服了Hive SQL分布式的方法只比较具有某一相同属性的对象而漏掉了大部分的其他相似对象的问题,同时减小了计算的复杂度,加快了计算速度,又提高了计算结果的准确率和相似对象的覆盖率。
公开/授权文献
0/0