MULTILINGUAL DOCUMENT RETRIEVAL SYSTEM AND METHOD USING SEMANTIC VECTOR MATCHING
    1.
    发明公开
    MULTILINGUAL DOCUMENT RETRIEVAL SYSTEM AND METHOD USING SEMANTIC VECTOR MATCHING 失效
    系统在VERFAHREN ZUM WIEDERAUFFINDEN MEHRSPRACHIGER DOKUMENTE UNTER VERWENDUNG EINES SEMANTISCHER VEKTORVERGLEICHS

    公开(公告)号:EP0856175A4

    公开(公告)日:2000-05-24

    申请号:EP96928907

    申请日:1996-08-14

    申请人: UNIV SYRACUSE

    IPC分类号: G06F17/30 G06F17/28

    摘要: A document retrieval system (20) where a user can enter a query, including a natural query, in a desired one of a plurality of supported languages, and retrieve documents from a database (60) that includes documents in at least one other language of the plurality of supported languages. The user need not have any knowledge of the other languages. Each document in the database is subjected to a set of processing steps to generate a language-independent conceptual representation of the subject content of the document. The query is also subjected to a (possibly different) set of processing steps to generate a language-independent conceptual representation of the subject content of the query. Documents are matched to queries based on the conceptual-level contents of the document and query, and, optionally, on the basis of the term-based representation.

    摘要翻译: 一种文档检索系统,其中用户可以以多种支持的语言中期望的一种语言输入包括自然语言查询的查询,以及从数据库中检索包含多种支持语言的至少一种其他语言的文档的文档 。 用户不需要任何其他语言的知识。 数据库中的每个文档都经受一系列处理步骤,以生成文档的主题内容的与语言无关的概念表示。 这通常在输入查询之前完成。 查询也受到(可能不同的)一组处理步骤,以生成查询的主题内容的与语言无关的概念表示。 这些文件和查询也可以进行额外的分析,以提供额外的基于术语的表示,例如提取信息丰富的术语和短语(如专有名词)。 文档与基于文档和查询的概念级内容的查询匹配,以及可选地,基于基于术语的表示。 然后将查询的表示与每个文档的表示进行比较,以生成文档与查询的相关性的度量。