发明授权
- 专利标题: 多语言文档聚类
-
申请号: CN201380047819.7申请日: 2013-07-11
-
公开(公告)号: CN104620241B公开(公告)日: 2018-12-07
- 发明人: 基里尔·布里亚克
- 申请人: 谷歌有限责任公司
- 申请人地址: 美国加利福尼亚州
- 专利权人: 谷歌有限责任公司
- 当前专利权人: 谷歌有限责任公司
- 当前专利权人地址: 美国加利福尼亚州
- 代理机构: 北京市柳沈律师事务所
- 代理商 邵亚丽
- 优先权: 13/549,624 2012.07.16 US
- 国际申请: PCT/US2013/050018 2013.07.11
- 国际公布: WO2014/014732 EN 2014.01.23
- 进入国家日期: 2015-03-13
- 主分类号: G06F17/30
- IPC分类号: G06F17/30 ; G06F17/28 ; G06F17/40
摘要:
一种技术,能够包括:识别待聚类的文档集。所述文档集能够包括外语文档和基础语言文档。在基础语言翻译模块处能够将外语文档翻译成基础语言。在文档索引模块处能够确定基础语言文档中的关键字和经翻译的外语文档中的关键字。基于基础语言文档中的确定的关键字和经翻译的外语文档中的确定的关键字,能够将基础语言文档与外语文档聚类在文档聚类的公共集合中。响应于第一语言的搜索查询,能够提供搜索结果的列表,其包括公共文档聚类中的第一语言的文档和另一语言的文档。
公开/授权文献
- CN104620241A 多语言文档聚类 公开/授权日:2015-05-13