• 专利标题: 面向广域网的音视频智能编目信息获取方法
  • 专利标题(英): Audio/video intelligent catalog information acquisition method facing to wide area network
  • 申请号: CN201010537106.7
    申请日: 2010-11-05
  • 公开(公告)号: CN101968819B
    公开(公告)日: 2012-05-30
  • 发明人: 隋爱娜王永滨伏文龙
  • 申请人: 中国传媒大学
  • 申请人地址: 北京市朝阳区定福庄东街1号
  • 专利权人: 中国传媒大学
  • 当前专利权人: 中国传媒大学
  • 当前专利权人地址: 北京市朝阳区定福庄东街1号
  • 主分类号: G06F17/30
  • IPC分类号: G06F17/30
面向广域网的音视频智能编目信息获取方法
摘要:
面向广域网的音视频智能编目信息获取方法,属计算机应用领域。本发明特征在于,提出了基于关键词特征项位置因素的权重算法,对文档中不同位置的特征项赋予不同的加权因子,进而更准确地计算网页内容的主题相似度;综合利用网页内容相似度、超链接的URL目录层次信息、超链接的锚文本信息三方面因素,优化选择主题相似度更高的链接。对搜索到的主题页面,采用基于本体和HTML的信息提取方法自动提取出编目信息。采用改进的语义相似度计算方法,对提取到的编目信息进行规范化。本发明能够智能、自动地为编目者提供著录项信息,减轻人工劳动量,提高编目效率,能够适应专业和非专业编目者的不同需求,也能适应广域网环境。
公开/授权文献
0/0