- 专利标题: 查询语句与网页相似度的确定方法、装置、终端及服务器
- 专利标题(英): Method and device for determining similarity between inquiry sentence and webpage, terminal and server
-
申请号: CN201410592231.6申请日: 2014-10-29
-
公开(公告)号: CN104331449A公开(公告)日: 2015-02-04
- 发明人: 呉先超
- 申请人: 百度在线网络技术(北京)有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦三层
- 专利权人: 百度在线网络技术(北京)有限公司
- 当前专利权人: 百度在线网络技术(北京)有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦三层
- 代理机构: 北京品源专利代理有限公司
- 代理商 路凯; 胡彬
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明实施例公开了查询语句与网页相似度的确定方法、装置、终端及服务器。该方法包括:通过预先创建的短语翻译模型,将目标查询语句翻译为具有相似语义的至少一条候选语句;根据所述至少一条候选语句与网页主题句之间的相似度,确定目标查询语句和网页主题句之间的相似度;其中,所述网页主题句为网页标题,或者基于设定算法对网页内容进行解析得到的用于描述网页主要内容的语句。本实施例提供的技术方案,可以提高搜索引擎对任一查询语句的网页召回率,使得搜索引擎能够针对表现形式不同而语义相似的各条查询句,返回相差较小的网页集合,提升用户对查询结果的满意度。
公开/授权文献
- CN104331449B 查询语句与网页相似度的确定方法、装置、终端及服务器 公开/授权日:2017-10-27