文書検索システム、及び文書検索方法
Abstract:
検索者の能力によらず文書を効率良く検索できる文書検索システムを実現する。 データベース文書データが記憶されている文書検索システムを用いて文書検索を行う。第1の文書 データ及び第2の文書データが文書検索システムに入力された後、当該文書検索システムは、第1 の文書データから複数の用語を抽出する。用語の抽出は、例えば形態素解析を用いて行う。次に、 第2の文書データを基にして、抽出した用語に対して重み付けを行う。例えば、第2の文書データ が表す文書に含まれる文章を、第1及び第2の文章に区分する。第1の文書データから抽出した用 語のうち、第1の文章に含まれる用語の重みを、その他の用語の重みより大きくする。文章の区分 は、ルールベース、又は機械学習を用いて行うことができる。その後、重み付けを行った用語を基 にして、データベース文書データの、第1の文書データに対する類似度を算出する。
Patent Agency Ranking
0/0