用于多语言信息检索的系统、方法、软件和界面
摘要:
本发明人已经设计出了一种或多种新颖的方法、系统和界面用于帮助实现多语言搜索。一种示范方法需要为文档总集创建多个语言专有索引,每个索引包括来自文档的项的词干化和未词干化的版本。用户提交与一组一个或多个目标语言相关联的查询。查询处理需要使用产生一组可能的等价查询项的一种或多种技术将查询中的每个项的初始版本和词干化版本翻译成各个目标语言。然后使用传统的单语言搜索技术,例如布尔或自然语言查询,针对相应的语言专有索引处理每组可能的等价查询项以从该总集中识别出文档。得到的文档被按语言分组或按计算出的相关性呈现给用户。
0/0