一种基于知识图谱的社区演化分析方法及装置

    公开(公告)号:CN110019845B

    公开(公告)日:2021-04-09

    申请号:CN201910303799.4

    申请日:2019-04-16

    申请人: 济南大学

    IPC分类号: G06F16/36 G06F16/332

    摘要: 本公开公开了一种基于知识图谱的社区演化分析方法及装置,该方法包括:调取数据库中某领域特定时间的文献信息,构建待分析关系网络;检测每个时间步的待分析关系网络的社区结构;构建相同无序对比例矩阵计算相似性阈值,根据两个社区的所述相同无序对比例的值与相似性阈值判断两个社区间的相似性;根据社区间的相似性构建社区相似矩阵,进行社区匹配,采用非连续时间步跟踪社区演化依次获得每个社区的演化序列,同时检测社区生命周期中的关键事件,并统计所述关键事件的数量来反映社区的演化状况。

    基于变异系数自动确认簇数量的聚类方法、系统及介质

    公开(公告)号:CN109063769B

    公开(公告)日:2021-04-09

    申请号:CN201810864958.3

    申请日:2018-08-01

    申请人: 济南大学

    IPC分类号: G06K9/62

    摘要: 本发明公开了基于变异系数自动确认簇数量的聚类方法、系统及介质,计算数据集中每个数据点的密度值,根据密度值计算密度指数,选择密度指数最大的数据点作为第一个聚类中心;计算每个数据点与当前已有聚类中心之间的最短距离,然后根据最短距离计算每个数据点被选为聚类中心的概率,按照轮盘法预选聚类中心;直至选择出设定个聚类中心,根据选择出的初始聚类中心进行k‑means聚类从而产生相应个数的簇;计算平均簇内变异系数和最小簇间变异系数,然后,计算平均簇内变异系数和最小簇间变异系数的差值,将差值与设定值进行比较,如果差值小于设定值,则将两个簇间变异系数最小的两个簇进行合并;直至差值大于等于设定值,则输出聚类结果。

    一种面向流程对象的工业过程建模预测方法

    公开(公告)号:CN104732067A

    公开(公告)日:2015-06-24

    申请号:CN201510088090.9

    申请日:2015-02-26

    申请人: 济南大学

    IPC分类号: G06F19/00

    摘要: 本发明公开了一种面向流程对象的工业过程建模预测方法,包括如下步骤:FNT模型建立,从流程对象已经生成的数据仓库中抽取工业流程对象原始数据集S,创建FNT模型的初始种群,种群个体数目根据需要定制,每个个体表示一个FNT模型;利用PIPE算法优化FNT模型结构,适应值函数采用均方误差或均方根误差;利用微粒群(PSO)算法优化FNT模型参数;利用FNT模型对流程对象生产过程进行建模预测。本发明基于柔性神经树获取流程对象各测点数据的变化趋势公式,对工业生产过程进行模拟,基于当前生产状态的相关参数预测未来一段时间的生产状态,从而辅助指导企业调整生产流程参数,在微观上引导生产趋利避害。

    一种面向流程对象数据的规则提取方法

    公开(公告)号:CN104346442B

    公开(公告)日:2017-10-20

    申请号:CN201410541881.8

    申请日:2014-10-14

    申请人: 济南大学

    IPC分类号: G06F17/30

    摘要: 本发明涉及一种面向流程对象数据的规则提取方法,包括如下步骤:步骤S1:确定流程对象数据的最佳聚簇数量;步骤S2:采用K‑means算法对流程对象数据进行聚类,同时验证步骤S1中的最佳聚簇数量的合理性,如果步骤S1中的最佳聚簇数量合理则转到步骤S3,否则转到步骤S1;步骤S3:采用Apriori维间关联规则算法挖掘不同测点的聚类间的关联规则;步骤S4:确定流程对象数据的最强关联链;步骤S5:根据最强关联链上所有测点的状态值,得到记载各测点状态值的状态链,根据状态链对相关行业进行指导;提高数据规则提取的效率,以及从流程对象数据中提取知识的能力。

    基于变异系数自动确认簇数量的聚类方法、系统及介质

    公开(公告)号:CN109063769A

    公开(公告)日:2018-12-21

    申请号:CN201810864958.3

    申请日:2018-08-01

    申请人: 济南大学

    IPC分类号: G06K9/62

    CPC分类号: G06K9/6223

    摘要: 本发明公开了基于变异系数自动确认簇数量的聚类方法、系统及介质,计算数据集中每个数据点的密度值,根据密度值计算密度指数,选择密度指数最大的数据点作为第一个聚类中心;计算每个数据点与当前已有聚类中心之间的最短距离,然后根据最短距离计算每个数据点被选为聚类中心的概率,按照轮盘法预选聚类中心;直至选择出设定个聚类中心,根据选择出的初始聚类中心进行k‑means聚类从而产生相应个数的簇;计算平均簇内变异系数和最小簇间变异系数,然后,计算平均簇内变异系数和最小簇间变异系数的差值,将差值与设定值进行比较,如果差值小于设定值,则将两个簇间变异系数最小的两个簇进行合并;直至差值大于等于设定值,则输出聚类结果。

    一种基于密度和扩展网格的数据流聚类方法

    公开(公告)号:CN107273532A

    公开(公告)日:2017-10-20

    申请号:CN201710509733.1

    申请日:2017-06-28

    申请人: 济南大学

    IPC分类号: G06F17/30 G06K9/62

    CPC分类号: G06F17/30539 G06K9/6223

    摘要: 本发明涉及一种基于密度和扩展网格的数据流聚类方法,利用Spark并行计算平台,对传统的数据流聚类算法进行了分析和改进,提出了基于密度和扩展网格的数据流聚类算法,改进了人工设置聚类参数的缺陷,可以得到任何形状的聚类,算法基本步骤如下:1、采用每个采样点的局部密度和与其他采样点的距离,确定了网格中的聚类中心数,自动确定聚类中心,避免了初始质心选取不当对聚类结果的影响;2、网格聚类以外的数据点,通过扩展网格,扩展了网格内的聚类,确保了聚类的准确性;3、引入相邻密度估计与网格边界实现网格的合并,节省内存消耗;4、采用衰减因子实时更新网格密度,反应空间数据流的演变过程。

    一种流程对象原始数据时序发现与调整方法

    公开(公告)号:CN104346169B

    公开(公告)日:2017-06-16

    申请号:CN201410542448.6

    申请日:2014-10-14

    申请人: 济南大学

    IPC分类号: G06F9/44

    摘要: 本发明公开了一种流程对象原始数据时序发现与调整方法,包括:数据取样步骤,对流程对象各环节测点在时间T内采集到的原始数据集进行抽样,抽取单位时间段内变化量最大的数据片段作为样本数据;时序发现步骤,以任意环节测点为基测点,计算其与其他环节测点间的时间距,从而获得包含所有环节测点时间顺序的时间序列L;时序调整步骤,根据时间序列L对各环节测点原始数据进行时序调整。本发明对原始数据进行抽样、发现时序并调整时序,具有简单、精确、人为干预少的优点,以解决现有流程工业中原始数据错漏较多,无法体现各个环节间的相互影响关系的问题。

    一种流程对象原始数据时序发现与调整方法

    公开(公告)号:CN104346169A

    公开(公告)日:2015-02-11

    申请号:CN201410542448.6

    申请日:2014-10-14

    申请人: 济南大学

    IPC分类号: G06F9/44

    摘要: 本发明公开了一种流程对象原始数据时序发现与调整方法,包括:数据取样步骤,对流程对象各环节测点在时间T内采集到的原始数据集进行抽样,抽取单位时间段内变化量最大的数据片段作为样本数据;时序发现步骤,以任意环节测点为基测点,计算其与其他环节测点间的时间距,从而获得包含所有环节测点时间顺序的时间序列L;时序调整步骤,根据时间序列L对各环节测点原始数据进行时序调整。本发明对原始数据进行抽样、发现时序并调整时序,具有简单、精确、人为干预少的优点,以解决现有流程工业中原始数据错漏较多,无法体现各个环节间的相互影响关系的问题。

    一种面向流式数据的并行增量式关联规则挖掘方法

    公开(公告)号:CN107229751A

    公开(公告)日:2017-10-03

    申请号:CN201710507953.0

    申请日:2017-06-28

    申请人: 济南大学

    IPC分类号: G06F17/30

    摘要: 本发明涉及一种面向流式数据的并行增量式关联规则挖掘方法,对传统静态的关联规则挖掘方法进行了改进,提出了面向动态数据流的并行增量式关联规则提取方法,其基本步骤如下:1、在原事务数据库中,根据数据对象的时序划分层次,将整个事务数据库随机划分成若干个非重叠区域;2、利用并行计算平台挖掘出局部频繁项集,生成全局候选项集,进而计算得到全局频繁项集;3、对新增数据流进行增量挖掘,使用局部剪枝的方法,减少扫描数据集次数,得到增量式全局规则。

    一种面向流程对象数据的规则提取方法

    公开(公告)号:CN104346442A

    公开(公告)日:2015-02-11

    申请号:CN201410541881.8

    申请日:2014-10-14

    申请人: 济南大学

    IPC分类号: G06F17/30

    CPC分类号: G06F16/35

    摘要: 本发明涉及一种面向流程对象数据的规则提取方法,包括如下步骤:步骤S1:确定流程对象数据的最佳聚簇数量;步骤S2:采用K-means算法对流程对象数据进行聚类,同时验证步骤S1中的最佳聚簇数量的合理性,如果步骤S1中的最佳聚簇数量合理则转到步骤S3,否则转到步骤S1;步骤S3:采用Apriori维间关联规则算法挖掘不同测点的聚类间的关联规则;步骤S4:确定流程对象数据的最强关联链;步骤S5:根据最强关联链上所有测点的状态值,得到记载各测点状态值的状态链,根据状态链对相关行业进行指导;提高数据规则提取的效率,以及从流程对象数据中提取知识的能力。