• 专利标题: 面向互联网的有意义串的提取方法及装置
  • 专利标题(英): Extraction method and device for Internet-oriented meaningful strings
  • 申请号: CN201010179684.8
    申请日: 2010-05-24
  • 公开(公告)号: CN101853284A
    公开(公告)日: 2010-10-06
  • 发明人: 王巍杨武苘大鹏董红臣
  • 申请人: 哈尔滨工程大学
  • 申请人地址: 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室
  • 专利权人: 哈尔滨工程大学
  • 当前专利权人: 哈尔滨工程大学
  • 当前专利权人地址: 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室
  • 主分类号: G06F17/30
  • IPC分类号: G06F17/30
面向互联网的有意义串的提取方法及装置
摘要:
本发明提供的是一种面向互联网的有意义串的提取方法及装置。提取方法包括提取重复字符串,通过串内分析过滤所述字符串,通过串外分析过滤所述字符串,通过串间分析过滤所述字符串步骤;提取装置包括依次串接的重复串发现模块、串内分析模块、串外分析模块和串间分析模块。本发明能够有效的提取新闻网页和论坛上的有意义串。本发明可广泛应用于网络舆情管理、互联网智能信息处理等应用领域。
公开/授权文献
0/0