一种面向有意义串挖掘的重复串提取方法及装置

    公开(公告)号:CN101794308B

    公开(公告)日:2012-03-14

    申请号:CN201010117305.2

    申请日:2010-03-04

    Abstract: 本发明提供的是一种面向有意义串挖掘的重复串提取方法及装置。方法包括下列步骤:步骤A:语料预处理;步骤B:重复串提取;步骤C:重复串修剪。装置由语料预处理模块、重复串发现模块和重复串修剪模块连接组成。本发明提取的重复串可经过进一步深度分析以得到有意义串,可以广泛应用于网络舆情管理、互联网智能信息处理等应用领域。

    面向互联网的有意义串的提取方法及装置

    公开(公告)号:CN101853284B

    公开(公告)日:2012-02-01

    申请号:CN201010179684.8

    申请日:2010-05-24

    Abstract: 本发明提供的是一种面向互联网的有意义串的提取方法及装置。提取方法包括提取重复字符串,通过串内分析过滤所述字符串,通过串外分析过滤所述字符串,通过串间分析过滤所述字符串步骤;提取装置包括依次串接的重复串发现模块、串内分析模块、串外分析模块和串间分析模块。本发明能够有效的提取新闻网页和论坛上的有意义串。本发明可广泛应用于网络舆情管理、互联网智能信息处理等应用领域。

    一种面向有意义串挖掘的重复串提取方法及装置

    公开(公告)号:CN101794308A

    公开(公告)日:2010-08-04

    申请号:CN201010117305.2

    申请日:2010-03-04

    Abstract: 本发明提供的是一种面向有意义串挖掘的重复串提取方法及装置。方法包括下列步骤:步骤A:语料预处理;步骤B:重复串提取;步骤C:重复串修剪。装置由语料预处理模块、重复串发现模块和重复串修剪模块连接组成。本发明提取的重复串可经过进一步深度分析以得到有意义串,可以广泛应用于网络舆情管理、互联网智能信息处理等应用领域。

    面向互联网的有意义串的提取方法及装置

    公开(公告)号:CN101853284A

    公开(公告)日:2010-10-06

    申请号:CN201010179684.8

    申请日:2010-05-24

    Abstract: 本发明提供的是一种面向互联网的有意义串的提取方法及装置。提取方法包括提取重复字符串,通过串内分析过滤所述字符串,通过串外分析过滤所述字符串,通过串间分析过滤所述字符串步骤;提取装置包括依次串接的重复串发现模块、串内分析模块、串外分析模块和串间分析模块。本发明能够有效的提取新闻网页和论坛上的有意义串。本发明可广泛应用于网络舆情管理、互联网智能信息处理等应用领域。

Patent Agency Ranking