基于变异系数自动确认簇数量的聚类方法、系统及介质

    公开(公告)号:CN109063769A

    公开(公告)日:2018-12-21

    申请号:CN201810864958.3

    申请日:2018-08-01

    申请人: 济南大学

    IPC分类号: G06K9/62

    CPC分类号: G06K9/6223

    摘要: 本发明公开了基于变异系数自动确认簇数量的聚类方法、系统及介质,计算数据集中每个数据点的密度值,根据密度值计算密度指数,选择密度指数最大的数据点作为第一个聚类中心;计算每个数据点与当前已有聚类中心之间的最短距离,然后根据最短距离计算每个数据点被选为聚类中心的概率,按照轮盘法预选聚类中心;直至选择出设定个聚类中心,根据选择出的初始聚类中心进行k‑means聚类从而产生相应个数的簇;计算平均簇内变异系数和最小簇间变异系数,然后,计算平均簇内变异系数和最小簇间变异系数的差值,将差值与设定值进行比较,如果差值小于设定值,则将两个簇间变异系数最小的两个簇进行合并;直至差值大于等于设定值,则输出聚类结果。

    一种基于知识图谱的社区演化分析方法及装置

    公开(公告)号:CN110019845B

    公开(公告)日:2021-04-09

    申请号:CN201910303799.4

    申请日:2019-04-16

    申请人: 济南大学

    IPC分类号: G06F16/36 G06F16/332

    摘要: 本公开公开了一种基于知识图谱的社区演化分析方法及装置,该方法包括:调取数据库中某领域特定时间的文献信息,构建待分析关系网络;检测每个时间步的待分析关系网络的社区结构;构建相同无序对比例矩阵计算相似性阈值,根据两个社区的所述相同无序对比例的值与相似性阈值判断两个社区间的相似性;根据社区间的相似性构建社区相似矩阵,进行社区匹配,采用非连续时间步跟踪社区演化依次获得每个社区的演化序列,同时检测社区生命周期中的关键事件,并统计所述关键事件的数量来反映社区的演化状况。

    基于变异系数自动确认簇数量的聚类方法、系统及介质

    公开(公告)号:CN109063769B

    公开(公告)日:2021-04-09

    申请号:CN201810864958.3

    申请日:2018-08-01

    申请人: 济南大学

    IPC分类号: G06K9/62

    摘要: 本发明公开了基于变异系数自动确认簇数量的聚类方法、系统及介质,计算数据集中每个数据点的密度值,根据密度值计算密度指数,选择密度指数最大的数据点作为第一个聚类中心;计算每个数据点与当前已有聚类中心之间的最短距离,然后根据最短距离计算每个数据点被选为聚类中心的概率,按照轮盘法预选聚类中心;直至选择出设定个聚类中心,根据选择出的初始聚类中心进行k‑means聚类从而产生相应个数的簇;计算平均簇内变异系数和最小簇间变异系数,然后,计算平均簇内变异系数和最小簇间变异系数的差值,将差值与设定值进行比较,如果差值小于设定值,则将两个簇间变异系数最小的两个簇进行合并;直至差值大于等于设定值,则输出聚类结果。

    一种基于知识图谱的社区演化分析方法及装置

    公开(公告)号:CN110019845A

    公开(公告)日:2019-07-16

    申请号:CN201910303799.4

    申请日:2019-04-16

    申请人: 济南大学

    IPC分类号: G06F16/36 G06F16/332

    摘要: 本公开公开了一种基于知识图谱的社区演化分析方法及装置,该方法包括:调取数据库中某领域特定时间的文献信息,构建待分析关系网络;检测每个时间步的待分析关系网络的社区结构;构建相同无序对比例矩阵计算相似性阈值,根据两个社区的所述相同无序对比例的值与相似性阈值判断两个社区间的相似性;根据社区间的相似性构建社区相似矩阵,进行社区匹配,采用非连续时间步跟踪社区演化依次获得每个社区的演化序列,同时检测社区生命周期中的关键事件,并统计所述关键事件的数量来反映社区的演化状况。