一种随机型分布式数据流频繁项集挖掘系统及其方法

    公开(公告)号:CN101887450A

    公开(公告)日:2010-11-17

    申请号:CN201010179445.2

    申请日:2010-05-19

    Abstract: 本发明是一种随机型分布式数据流频繁项集挖掘系统,采用全新的频繁项事务的分布式数据流挖掘模式,并引入随机型频繁项混合器提高挖掘精度,数据流中到达基本窗口数量的新事务时,按事务中所包含的不同项根据数据项分割方法分别发送至n个频繁项集挖掘器,不同的数据项附有其所属事务号,在频繁项集挖掘器中通过对不同的频繁项事务进行与操作以挖掘频繁项集,并将挖掘出的频繁项集汇总至频繁项集存储器存储。最后将数据项通过频繁项随机混合器反馈至数据项分割器,进行深层次挖掘。其方法与其它方法相比,具有内存空间占用小、响应速度快等优点,同时能够通过增加频繁项集挖掘器数量或反馈次数来确保模式挖掘的覆盖率。

    一种智能电网海量数据流的分布式数据挖掘方法

    公开(公告)号:CN101694667A

    公开(公告)日:2010-04-14

    申请号:CN200910217750.3

    申请日:2009-10-19

    Abstract: 本发明一种智能电网海量数据流的分布式数据挖掘方法,其特点是它包含有:将海量数据流按信息窗大小,采用一数据分流器按序分割成各数据子流;将各数据子流分别发送至各数据预处理器;各数据预处理器分别进行数据预处理;对预处理后的数据采用若干个数据挖掘器进行数据流挖掘;将若干个数据挖掘器挖掘得出的各个模式,采用一模式整合器按所述序列进行整合;输出整合后的模式结果。由于数据预处理与数据挖掘的并行处理,大大提高了海量数据流挖掘的效率,能有效满足智能电网中海量数据流挖掘的实时性要求。

Patent Agency Ranking