发明公开
- 专利标题: 用于多语言信息检索的系统、方法、软件和界面
- 专利标题(英): Systems, methods, software, and interfaces for multilingual information retrieval
-
申请号: CN200680001792.8申请日: 2006-01-04
-
公开(公告)号: CN101099153A公开(公告)日: 2008-01-02
- 发明人: I·穆利尼耶 , E·S·伦德
- 申请人: 汤姆森环球资源公司
- 申请人地址: 瑞士祖格
- 专利权人: 汤姆森环球资源公司
- 当前专利权人: 汤森路透企业中心有限公司
- 当前专利权人地址: 瑞士祖格
- 代理机构: 中国专利代理(香港)有限公司
- 代理商 王岳; 王忠忠
- 优先权: 60/641,669 2005.01.04 US
- 国际申请: PCT/US2006/000394 2006.01.04
- 国际公布: WO2006/074324 EN 2006.07.13
- 进入国家日期: 2007-07-04
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明人已经设计出了一种或多种新颖的方法、系统和界面用于帮助实现多语言搜索。一种示范方法需要为文档总集创建多个语言专有索引,每个索引包括来自文档的项的词干化和未词干化的版本。用户提交与一组一个或多个目标语言相关联的查询。查询处理需要使用产生一组可能的等价查询项的一种或多种技术将查询中的每个项的初始版本和词干化版本翻译成各个目标语言。然后使用传统的单语言搜索技术,例如布尔或自然语言查询,针对相应的语言专有索引处理每组可能的等价查询项以从该总集中识别出文档。得到的文档被按语言分组或按计算出的相关性呈现给用户。
公开/授权文献
- CN100492364C 用于多语言信息检索的系统、方法、软件和界面 公开/授权日:2009-05-27