多语言文档聚类
摘要:
一种技术,能够包括:识别待聚类的文档集。所述文档集能够包括外语文档和基础语言文档。在基础语言翻译模块处能够将外语文档翻译成基础语言。在文档索引模块处能够确定基础语言文档中的关键字和经翻译的外语文档中的关键字。基于基础语言文档中的确定的关键字和经翻译的外语文档中的确定的关键字,能够将基础语言文档与外语文档聚类在文档聚类的公共集合中。响应于第一语言的搜索查询,能够提供搜索结果的列表,其包括公共文档聚类中的第一语言的文档和另一语言的文档。
公开/授权文献
0/0