-
公开(公告)号:CN118260616A
公开(公告)日:2024-06-28
申请号:CN202410493009.4
申请日:2024-04-23
IPC分类号: G06F18/23 , G06F18/231 , G06F17/10 , G06F17/16
摘要: 本发明公开了一种基于邻接引力的最优连接聚类方法及系统,涉及机器学习技术领域。包括:采集多个数据样本,组成数据簇;对数据簇进行划分得到多个子数据簇,计算各个子数据簇之间的邻接引力;对邻接引力矩阵进行权重化处理,基于权重化矩阵,遍历当前所有子数据簇,构建最优连接矩阵;基于最优连接矩阵对子数据簇进行链式聚合,得到当前子数据簇数目;判断当前子数据簇数目是否满足数据簇期望数目,若满足则输出当前子数据簇作为最终聚类结果,否则返回S2。本发明创新性地提出了邻接引力、孤点权重化的概念,通过定义全新的子类之间的距离表征形式以及孤点聚类处理方法,提高了数据在不同流型空间分布的聚类效果。