一种时序数据流模式识别方法及装置

    公开(公告)号:CN117992804B

    公开(公告)日:2024-07-09

    申请号:CN202410404447.9

    申请日:2024-04-07

    申请人: 东海实验室

    摘要: 本发明公开了一种时序数据流模式识别方法及装置,首先,基于二进制编码的转折模式切分数据流;然后,利用第一类切比雪夫多项式分解子序列,抽取切比雪夫特征;最后,基于增量式动态规划方法进行时序数据流模式匹配。本发明基于切比雪夫特征可对原始数据流波动形态进行准确拟合,大幅降低数据维度的同时减少信息损失,并且实现了动态时间弯曲度量在高速时序数据流上的增量式计算,因此,本发明在模式识别准确率和计算效率方面都具有显著优势。在人们的日常活动和工业生产中可发挥重要作用,如在金融交易、交通管理、气象观测、工业流程监控、医疗诊断等应用中,能够对大规模采样数据或高速动态数据流进行异常检测、风险监控、实时问答等。

    一种适应性混合多元时间序列数据预测方法

    公开(公告)号:CN118094338B

    公开(公告)日:2024-08-27

    申请号:CN202410366271.2

    申请日:2024-03-28

    申请人: 东海实验室

    摘要: 本发明公开了一种适应性混合多元时间序列数据预测方法,包括子序列聚类模型构建、子序列分类模型构建、预测模型构建和预测评价步骤。首先,将多元子序列和各维度一元子序列分别聚类;然后,以簇标签为样本标签分别训练一元子序列和多元子序列分类模型;其后,分别在每个簇内训练各自预测模型;最后,在预测阶段根据分类模型对待预测序列进行分类,并选择所在类别的预测模型进行预测,基于马氏距离评价预测结果并优化模型。本发明在预测过程同时考虑了多元时间序列的分量特征和维度间的相关性信息,因此具有较高的准确率,在大数据和数据挖掘、人工智能、数据库等领域可发挥重要作用。

    基于公共主成分映射的多元时间序列数据聚类方法

    公开(公告)号:CN118228070A

    公开(公告)日:2024-06-21

    申请号:CN202410365665.6

    申请日:2024-03-28

    申请人: 东海实验室

    IPC分类号: G06F18/23 G06F123/02

    摘要: 本发明公开了基于公共主成分映射的多元时间序列数据聚类方法,包括公共映射空间构建、元素重构和聚类;首先,计算各簇内多元时间序列数据的平均协方差矩阵,并采用奇异值分解进行降维,构建簇内公共映射空间;然后,根据各簇的公共映射轴重构多元时间序列数据,得到重构的多元时间序列数据,并根据重构误差分配多元时间序列数据至相应的簇;最后,根据多元时间序列数据集总体重构误差最小化原则优化公共映射空间。本发明具有较高的聚类精度及运行效率,对时间序列长度、多元时间序列数据维度和数目具有良好的扩展性,在大数据和数据挖掘、人工智能、数据库等领域可发挥重要作用。

    一种适应性混合多元时间序列数据预测方法

    公开(公告)号:CN118094338A

    公开(公告)日:2024-05-28

    申请号:CN202410366271.2

    申请日:2024-03-28

    申请人: 东海实验室

    摘要: 本发明公开了一种适应性混合多元时间序列数据预测方法,包括子序列聚类模型构建、子序列分类模型构建、预测模型构建和预测评价步骤。首先,将多元子序列和各维度一元子序列分别聚类;然后,以簇标签为样本标签分别训练一元子序列和多元子序列分类模型;其后,分别在每个簇内训练各自预测模型;最后,在预测阶段根据分类模型对待预测序列进行分类,并选择所在类别的预测模型进行预测,基于马氏距离评价预测结果并优化模型。本发明在预测过程同时考虑了多元时间序列的分量特征和维度间的相关性信息,因此具有较高的准确率,在大数据和数据挖掘、人工智能、数据库等领域可发挥重要作用。

    一种不定长时间序列数据相似性查询方法

    公开(公告)号:CN118245641B

    公开(公告)日:2024-09-17

    申请号:CN202410383252.0

    申请日:2024-04-01

    申请人: 东海实验室

    摘要: 本发明公开了一种不定长时间序列数据相似性查询方法,包括数据包络块构建、数据索引构建、查询处理三个步骤。首先,利用分段表示方法抽取不等长子序列的局部特征,并计算子段特征上下边界;然后,针对包络块数据构建符号聚集近似索引结构;最后,基于下界距离快速过滤候选集,实现近似查询和精确查询。本发明提出的数据包络技术可有效支持时间序列数据规范化,针对任意长的查询需求可实现统一高效的查询处理,本发明降低了数据存储的空间复杂度,保证了查询结果的相似性,显著提升了查询效率,且具有较高的稳健性,在大数据和数据挖掘、人工智能、数据库等领域可发挥重要作用。

    一种不定长时间序列数据相似性查询方法

    公开(公告)号:CN118245641A

    公开(公告)日:2024-06-25

    申请号:CN202410383252.0

    申请日:2024-04-01

    申请人: 东海实验室

    摘要: 本发明公开了一种不定长时间序列数据相似性查询方法,包括数据包络块构建、数据索引构建、查询处理三个步骤。首先,利用分段表示方法抽取不等长子序列的局部特征,并计算子段特征上下边界;然后,针对包络块数据构建符号聚集近似索引结构;最后,基于下界距离快速过滤候选集,实现近似查询和精确查询。本发明提出的数据包络技术可有效支持时间序列数据规范化,针对任意长的查询需求可实现统一高效的查询处理,本发明降低了数据存储的空间复杂度,保证了查询结果的相似性,显著提升了查询效率,且具有较高的稳健性,在大数据和数据挖掘、人工智能、数据库等领域可发挥重要作用。

    一种时序数据流模式识别方法及装置

    公开(公告)号:CN117992804A

    公开(公告)日:2024-05-07

    申请号:CN202410404447.9

    申请日:2024-04-07

    申请人: 东海实验室

    摘要: 本发明公开了一种时序数据流模式识别方法及装置,首先,基于二进制编码的转折模式切分数据流;然后,利用第一类切比雪夫多项式分解子序列,抽取切比雪夫特征;最后,基于增量式动态规划方法进行时序数据流模式匹配。本发明基于切比雪夫特征可对原始数据流波动形态进行准确拟合,大幅降低数据维度的同时减少信息损失,并且实现了动态时间弯曲度量在高速时序数据流上的增量式计算,因此,本发明在模式识别准确率和计算效率方面都具有显著优势。在人们的日常活动和工业生产中可发挥重要作用,如在金融交易、交通管理、气象观测、工业流程监控、医疗诊断等应用中,能够对大规模采样数据或高速动态数据流进行异常检测、风险监控、实时问答等。

    基于动态时间弯曲的多元时间序列异常检测方法

    公开(公告)号:CN117807456A

    公开(公告)日:2024-04-02

    申请号:CN202311842741.X

    申请日:2023-12-28

    申请人: 东海实验室

    摘要: 本发明公开了一种基于动态时间弯曲的多元时间序列异常检测方法,首先采用参数化的加权动态时间弯曲距离作为相似性度量方法,对多元时间序列样本进行模糊C均值聚类;然后以样本各维度的重要度作为约束条件,迭代优化模型得到最优加权动态时间弯曲距离;最后利用优化的相似性度量方法和簇中心对各样本进行重构并计算异常分值,实现对异常样本的识别。本发明可显著提高多元时间序列数据的异常检测准确率,在现实应用中可发挥重要作用,如在互联网用户行为监控中,针对高并发网络流量的异常诊断,能够帮助运维人员有效识别异常账户和攻击行为,提高网络安全性能,保障互联网的正常运行。