一种基于降维窗口的主成分分析方法及系统

    公开(公告)号:CN109241367A

    公开(公告)日:2019-01-18

    申请号:CN201810885037.5

    申请日:2018-08-06

    申请人: 济南大学

    IPC分类号: G06F16/904

    摘要: 本发明提供一种基于降维窗口的主成分分析方法及系统,包括如下步骤:1.输入待处理数据集X;S2.初始化降维窗口参数e和结束条件参数a;3.根据输入数据集X计算得到初始相关系数矩阵B;4.根据初始相关系数矩阵B计算得到相关系数矩阵P;5.根据相关系数矩阵P判断是否符合结束条件;若是,进入步骤6;若否,进入步骤7;6.输出降维结果数据集X`;7.为相关系数矩阵P添加降维窗口,并将相关系数矩阵P每行元素按大小排列;8.判断是否出现窗口溢出,或者,出现窗口宽度优化后无变化;若是,进入步骤9;若否,进入步骤10;9.优化降维窗口参数;返回步骤7;10.在降维窗口内对数据进行降维处理;返回步骤3。

    一种面向流式数据的并行增量式关联规则挖掘方法

    公开(公告)号:CN107229751A

    公开(公告)日:2017-10-03

    申请号:CN201710507953.0

    申请日:2017-06-28

    申请人: 济南大学

    IPC分类号: G06F17/30

    摘要: 本发明涉及一种面向流式数据的并行增量式关联规则挖掘方法,对传统静态的关联规则挖掘方法进行了改进,提出了面向动态数据流的并行增量式关联规则提取方法,其基本步骤如下:1、在原事务数据库中,根据数据对象的时序划分层次,将整个事务数据库随机划分成若干个非重叠区域;2、利用并行计算平台挖掘出局部频繁项集,生成全局候选项集,进而计算得到全局频繁项集;3、对新增数据流进行增量挖掘,使用局部剪枝的方法,减少扫描数据集次数,得到增量式全局规则。

    一种面向流程对象数据的规则提取方法

    公开(公告)号:CN104346442A

    公开(公告)日:2015-02-11

    申请号:CN201410541881.8

    申请日:2014-10-14

    申请人: 济南大学

    IPC分类号: G06F17/30

    CPC分类号: G06F16/35

    摘要: 本发明涉及一种面向流程对象数据的规则提取方法,包括如下步骤:步骤S1:确定流程对象数据的最佳聚簇数量;步骤S2:采用K-means算法对流程对象数据进行聚类,同时验证步骤S1中的最佳聚簇数量的合理性,如果步骤S1中的最佳聚簇数量合理则转到步骤S3,否则转到步骤S1;步骤S3:采用Apriori维间关联规则算法挖掘不同测点的聚类间的关联规则;步骤S4:确定流程对象数据的最强关联链;步骤S5:根据最强关联链上所有测点的状态值,得到记载各测点状态值的状态链,根据状态链对相关行业进行指导;提高数据规则提取的效率,以及从流程对象数据中提取知识的能力。

    基于网址域名的文本分词方法、系统、设备及介质

    公开(公告)号:CN111104801B

    公开(公告)日:2023-09-26

    申请号:CN201911367979.5

    申请日:2019-12-26

    申请人: 济南大学

    摘要: 本发明公开了基于网址域名的文本分词方法、系统、设备及介质,包括:数据采集,采集若干个网址域名;对每个网址域名进行分词处理;将分词处理后的单词进行文本格式化处理;分析文本格式化处理后得到单词的单词词性;根据单词词性进行词形还原;将词形还原后的结果存储到单词库中;将待分词的网址域名,采用双向最大匹配算法与单词库进行匹配,如果匹配成功,则得到文本向量化结果;如果匹配失败,则对待分词的网址域名进行清洗,将清洗后的结果再次采用双向最大匹配算法与单词库进行匹配。

    一种基于大数据分层聚类的棉花生产工艺优化方法

    公开(公告)号:CN109034486B

    公开(公告)日:2022-03-29

    申请号:CN201810884575.2

    申请日:2018-08-06

    申请人: 济南大学

    IPC分类号: G06Q10/04 G06Q10/06

    摘要: 本发明提供一种基于大数据分层聚类的棉花生产工艺优化方法,包括如下步骤:对获取的生产监测原始数据进行数据预处理;对经过预处理后的原始数据确定描述参数属性的关键参数;对确定的关键参数进行数值统计得到分布统计属性数值分布分组;根据分布统计中得到的数值分布分组,使样本中各项属性数据分别映射到各属性分组区间中,形成新的数据集;确定优化目标,进行生产工艺参数的优化。结合棉花加工流程工艺分析。可以用于企业对工艺参数的分析调整。从而优化棉花生产、提高棉花质量、维护企业生产安全。

    一种基于知识图谱的社区演化分析方法及装置

    公开(公告)号:CN110019845B

    公开(公告)日:2021-04-09

    申请号:CN201910303799.4

    申请日:2019-04-16

    申请人: 济南大学

    IPC分类号: G06F16/36 G06F16/332

    摘要: 本公开公开了一种基于知识图谱的社区演化分析方法及装置,该方法包括:调取数据库中某领域特定时间的文献信息,构建待分析关系网络;检测每个时间步的待分析关系网络的社区结构;构建相同无序对比例矩阵计算相似性阈值,根据两个社区的所述相同无序对比例的值与相似性阈值判断两个社区间的相似性;根据社区间的相似性构建社区相似矩阵,进行社区匹配,采用非连续时间步跟踪社区演化依次获得每个社区的演化序列,同时检测社区生命周期中的关键事件,并统计所述关键事件的数量来反映社区的演化状况。

    基于变异系数自动确认簇数量的聚类方法、系统及介质

    公开(公告)号:CN109063769B

    公开(公告)日:2021-04-09

    申请号:CN201810864958.3

    申请日:2018-08-01

    申请人: 济南大学

    IPC分类号: G06K9/62

    摘要: 本发明公开了基于变异系数自动确认簇数量的聚类方法、系统及介质,计算数据集中每个数据点的密度值,根据密度值计算密度指数,选择密度指数最大的数据点作为第一个聚类中心;计算每个数据点与当前已有聚类中心之间的最短距离,然后根据最短距离计算每个数据点被选为聚类中心的概率,按照轮盘法预选聚类中心;直至选择出设定个聚类中心,根据选择出的初始聚类中心进行k‑means聚类从而产生相应个数的簇;计算平均簇内变异系数和最小簇间变异系数,然后,计算平均簇内变异系数和最小簇间变异系数的差值,将差值与设定值进行比较,如果差值小于设定值,则将两个簇间变异系数最小的两个簇进行合并;直至差值大于等于设定值,则输出聚类结果。

    基于网址域名的文本分词方法、系统、设备及介质

    公开(公告)号:CN111104801A

    公开(公告)日:2020-05-05

    申请号:CN201911367979.5

    申请日:2019-12-26

    申请人: 济南大学

    摘要: 本发明公开了基于网址域名的文本分词方法、系统、设备及介质,包括:数据采集,采集若干个网址域名;对每个网址域名进行分词处理;将分词处理后的单词进行文本格式化处理;分析文本格式化处理后得到单词的单词词性;根据单词词性进行词形还原;将词形还原后的结果存储到单词库中;将待分词的网址域名,采用双向最大匹配算法与单词库进行匹配,如果匹配成功,则得到文本向量化结果;如果匹配失败,则对待分词的网址域名进行清洗,将清洗后的结果再次采用双向最大匹配算法与单词库进行匹配。

    一种面向流程对象的工业过程建模预测方法

    公开(公告)号:CN104732067A

    公开(公告)日:2015-06-24

    申请号:CN201510088090.9

    申请日:2015-02-26

    申请人: 济南大学

    IPC分类号: G06F19/00

    摘要: 本发明公开了一种面向流程对象的工业过程建模预测方法,包括如下步骤:FNT模型建立,从流程对象已经生成的数据仓库中抽取工业流程对象原始数据集S,创建FNT模型的初始种群,种群个体数目根据需要定制,每个个体表示一个FNT模型;利用PIPE算法优化FNT模型结构,适应值函数采用均方误差或均方根误差;利用微粒群(PSO)算法优化FNT模型参数;利用FNT模型对流程对象生产过程进行建模预测。本发明基于柔性神经树获取流程对象各测点数据的变化趋势公式,对工业生产过程进行模拟,基于当前生产状态的相关参数预测未来一段时间的生产状态,从而辅助指导企业调整生产流程参数,在微观上引导生产趋利避害。