• 专利标题: 一种基于编辑距离和后缀数组的时间序列变长模体挖掘方法
  • 申请号: CN202410804046.2
    申请日: 2024-06-20
  • 公开(公告)号: CN118606382A
    公开(公告)日: 2024-09-06
  • 发明人: 王继民王涛孙家豪朱滢
  • 申请人: 河海大学
  • 申请人地址: 江苏省南京市江宁区佛城西路8号
  • 专利权人: 河海大学
  • 当前专利权人: 河海大学
  • 当前专利权人地址: 江苏省南京市江宁区佛城西路8号
  • 主分类号: G06F16/2458
  • IPC分类号: G06F16/2458 G06F18/22 G06F17/18
一种基于编辑距离和后缀数组的时间序列变长模体挖掘方法
摘要:
本发明公开了一种基于编辑距离和后缀数组的时间序列变长模体挖掘方法,步骤为:(1)对时间序列按照窗口长度和步长提取子序列;(2)对提取出的子序列经过SAX符号表示将子序列变成符号序列;(3)选择DC3后缀数组算法对符号序列进行处理,获得后缀数组;(4)使用基于索引提取匹配前缀的方法,按照原始索引顺序在后缀数组中进行匹配前缀的搜索。(5)基于编辑距离的容错匹配,设置一个基于编辑距离的容错参数,进行容错匹配,减小字符串匹配的难度,便于找到更长且完整的变长模体。
0/0