面向广域网的音视频智能编目信息获取方法
摘要:
面向广域网的音视频智能编目信息获取方法,属计算机应用领域。本发明特征在于,提出了基于关键词特征项位置因素的权重算法,对文档中不同位置的特征项赋予不同的加权因子,进而更准确地计算网页内容的主题相似度;综合利用网页内容相似度、超链接的URL目录层次信息、超链接的锚文本信息三方面因素,优化选择主题相似度更高的链接。对搜索到的主题页面,采用基于本体和HTML的信息提取方法自动提取出编目信息。采用改进的语义相似度计算方法,对提取到的编目信息进行规范化。本发明能够智能、自动地为编目者提供著录项信息,减轻人工劳动量,提高编目效率,能够适应专业和非专业编目者的不同需求,也能适应广域网环境。
公开/授权文献
0/0