一种多元时序关联规则挖掘方法、分类方法及装置

    公开(公告)号:CN118395238A

    公开(公告)日:2024-07-26

    申请号:CN202410566958.0

    申请日:2024-05-09

    Applicant: 武汉大学

    Inventor: 何国良 代丽芳

    Abstract: 本发明提出了一种多元时序关联规则挖掘方法、分类方法及装置,通过记录从不同变量中提取的shapelets在其原始的序列中的出现顺序来捕获变量特征间的时序依赖关系。结合shapelets及它们之间的时序关系生成时序关联规则,使用基于快速卷积的相似性度量方法将原始的多变量时间序列转换到新的特征向量空间,把新的特征表示与分类器相结合后将其应用到多变量时间序列分类方法中。利用损失函数迭代地更新模型中shapelets挖掘模型、规则挖掘模型以及分类器模型参数,迭代过程结束后得到分类模型。

    一种早期分类不平衡多变量时间序列数据的方法

    公开(公告)号:CN104809226B

    公开(公告)日:2018-01-12

    申请号:CN201510229367.5

    申请日:2015-05-07

    Applicant: 武汉大学

    Abstract: 本发明公开了一种早期分类不平衡多变量时间序列数据的方法。首先,针对类间数据规模不平衡问题,根据不平衡性比例,将大类类别数据集欠采样划分为多个子集,分别与小类类别数据组合构成多个子训练集。其次,对各子训练集进行核特征的提取与选择,并以核特征构建基于规则的子分类器。其中,为了解决类内子概念的数据规模不平衡问题,特征选择过程采用聚类实现,以保证核特征的多样性。最后,基于各子分类器,以子分类器对训练集中数据的分类效果求取权重,构建集成分类器。本发明的该分类器能够针对不平衡数据集的多变量时间序列分类问题,达到较高的准确率与较好的早期度。

    基于个性化联邦学习的人体行为时序关联规则挖掘方法、个性行为识别方法及装置

    公开(公告)号:CN118503696A

    公开(公告)日:2024-08-16

    申请号:CN202410566951.9

    申请日:2024-05-09

    Applicant: 武汉大学

    Inventor: 何国良 代丽芳

    Abstract: 本发明针对传感器时序数据的规则挖掘问题,提出了基于个性化联邦学习的人体行为时序关联规则挖掘方法、个性行为识别方法及装置,首先,每个用户采用基于生成对抗网络的人体行为时序关联规则挖掘方法,从自身的私有数据集中挖掘局部时序关联规则。然后,各个用户将自己的局部时序关联规则上传到中心服务端,在服务端聚合各个用户的局部时序关联规则作为用户间共享的时序关联规则。接着,用户结合用户的局部私有数据和中心服务端下发的共享时序关联规则生成特定于用户的个性化时序关联规则。最后,结合个性化时序关联规则将原始的传感器数据转换为新的特征表示,并把新的特征表示送入识别模型进行人体行为识别。

    一种基于变量加权的软子空间聚类方法

    公开(公告)号:CN112418325A

    公开(公告)日:2021-02-26

    申请号:CN202011337158.X

    申请日:2020-11-25

    Applicant: 武汉大学

    Inventor: 何国良 蒋文君

    Abstract: 本发明提出了一种基于变量加权的软子空间聚类方法,解决了多元时间序列数据的聚类问题,消除了多元时间序列间冗余或相关变量的影响。本发明为不同变量分别分配一个权重向量,代表其对各个簇形成的重要性。为高效计算两个多元时间序列之间的距离,首先引入基于形状的距离度量方法。其次,该算法将变量权重嵌入基于形状的距离度量的目标函数中。然后优化目标函数,通过不同的更新策略对聚类结果,变量权重和聚类中心分别进行迭代更新,直到收敛后得到最终的聚类结果。提出一种基于反近邻的密度峰值学习算法来选取该软子空间聚类算法的初始聚类中心。通过对真实的多元时间序列数据进行实验,其实验结果证实了本发明所提算法的有效性和准确性。

    一种基于在线学习的多元时序数据规则挖掘方法

    公开(公告)号:CN112347162A

    公开(公告)日:2021-02-09

    申请号:CN202011292898.6

    申请日:2020-11-18

    Applicant: 武汉大学

    Inventor: 何国良 辛欣

    Abstract: 本发明公开了一种基于在线学习的多元时序数据规则挖掘方法,包括以下步骤:1)针对动态添加的多元时序数据,对各变量时间序列进行特征提取获得各变量的候选特征集,并对其分别进行聚类得到若干个簇,在每个簇中选取性能最佳的特征作为核特征,获得该变量时间序列的新数据特征集;2)对各变量的现有特征集和该变量对应的新数据特征集进行相似性查询,根据查询结果做出相应操作,获得多元时序数据的更新后的特征集;3)基于更新后的特征集进行分类规则的在线学习。本发明方法具有较好的可解释性、鲁棒性和稳定性。

    基于提取核特征早期预测多变量时间序列类别的分类方法

    公开(公告)号:CN103020643B

    公开(公告)日:2015-05-13

    申请号:CN201210507502.4

    申请日:2012-11-30

    Applicant: 武汉大学

    Inventor: 何国良 段勇

    Abstract: 针对早期预测多变量时间序列分类问题,本发明提出了基于提取核特征早期预测多变量时间序列类别的分类方法,为提取各个变量时间序列本质特性,首先对各变量时间序列分别进行特征提取,并采用聚类方法减少冗余特征与剔除噪音,提高分类的稳定性。其次,为提高分类的效率、精度和早期度,基于准确率、召回率和早期度等提出一种综合评价特征性能的方法,选择每个簇中的最优特征作为该变量的核特征。最后,基于各变量的核特征集,提出了两种简单且有效的分类器构造方法。通过实验验证本发明所提方法和算法的正确性和有效性,实验结果表明该分类器能够达到较高的准确率与较好的早期度。

    基于提取核特征早期预测多变量时间序列类别的分类方法

    公开(公告)号:CN103020643A

    公开(公告)日:2013-04-03

    申请号:CN201210507502.4

    申请日:2012-11-30

    Applicant: 武汉大学

    Inventor: 何国良 段勇

    Abstract: 针对早期预测多变量时间序列分类问题,本发明提出了基于提取核特征早期预测多变量时间序列类别的分类方法,为提取各个变量时间序列本质特性,首先对各变量时间序列分别进行特征提取,并采用聚类方法减少冗余特征与剔除噪音,提高分类的稳定性。其次,为提高分类的效率、精度和早期度,基于准确率、召回率和早期度等提出一种综合评价特征性能的方法,选择每个簇中的最优特征作为该变量的核特征。最后,基于各变量的核特征集,提出了两种简单且有效的分类器构造方法。通过实验验证本发明所提方法和算法的正确性和有效性,实验结果表明该分类器能够达到较高的准确率与较好的早期度。

    一种基于信息度和代表度的主动学习抽样方法

    公开(公告)号:CN112418293A

    公开(公告)日:2021-02-26

    申请号:CN202011296097.7

    申请日:2020-11-18

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于信息度和代表度的主动学习抽样方法,该方法包括以下步骤:1)对未标注数据集中多元时间序列,获取各时间序列的信息度和代表度;2)基于步骤1)中计算得到的信息度和代表度,通过抽样算法得到最有价值的未标记样本;3)对步骤2)抽样所得的未标注样本进行标注,并将标注后的样本加入标注数据集;4)判断是否满足停止标准,满足停止标准后得到更新后的标记数据集。本发明针对多元时间序列的主动学习问题,提出了一种抽取未标记时间序列样本的有效抽样算法,通过双优化抽样算法结合信息度和代表度进行抽样,能在保证准确度的条件下,有效减少未标记样本的抽样数目。

    基于约束非负矩阵分解的多视图聚类方法

    公开(公告)号:CN112418286A

    公开(公告)日:2021-02-26

    申请号:CN202011278395.3

    申请日:2020-11-16

    Applicant: 武汉大学

    Abstract: 针对高维多元时间序列的聚类问题,本发明提出了一种基于约束非负矩阵分解的多视图聚类方法,为了有效的进行样本聚类,首先将多元时序数据投影至一个多重关系网络,然后采用层次方法生成多个独立视图。其次,采用约束非负矩阵分解方法,对多个视图进行聚类。最后,采用交替迭代优化的方式进行求解,对由求解结果计算得到的表示矩阵进行k均值聚类得到聚类结果。通过实验验证本发明所提方法和算法的正确性和有效性,实验结果表明该聚类方法具有较高的准确性和有效性。

    一种早期分类不平衡多变量时间序列数据的方法

    公开(公告)号:CN104809226A

    公开(公告)日:2015-07-29

    申请号:CN201510229367.5

    申请日:2015-05-07

    Applicant: 武汉大学

    Abstract: 本发明公开了一种早期分类不平衡多变量时间序列数据的方法。首先,针对类间数据规模不平衡问题,根据不平衡性比例,将大类类别数据集欠采样划分为多个子集,分别与小类类别数据组合构成多个子训练集。其次,对各子训练集进行核特征的提取与选择,并以核特征构建基于规则的子分类器。其中,为了解决类内子概念的数据规模不平衡问题,特征选择过程采用聚类实现,以保证核特征的多样性。最后,基于各子分类器,以子分类器对训练集中数据的分类效果求取权重,构建集成分类器。本发明的该分类器能够针对不平衡数据集的多变量时间序列分类问题,达到较高的准确率与较好的早期度。

Patent Agency Ranking