Invention Application
- Patent Title: 文書検索システム、及び文書検索方法
- Patent Title (English): DOCUMENT SEARCH SYSTEM AND DOCUMENT SEARCH METHOD
-
Application No.: PCT/IB2020/054413Application Date: 2020-05-11
-
Publication No.: WO2020240312A1Publication Date: 2020-12-03
- Inventor: 山本一宇 , 桃純平 , 東和樹
- Applicant: 株式会社半導体エネルギー研究所
- Applicant Address: 〒2430036 神奈川県厚木市長谷398 Kanagawa JP
- Assignee: 株式会社半導体エネルギー研究所
- Current Assignee: 株式会社半導体エネルギー研究所
- Current Assignee Address: 〒2430036 神奈川県厚木市長谷398 Kanagawa JP
- Priority: JP2019-097468 20190524
- Main IPC: G06F16/35
- IPC: G06F16/35 ; G06F16/38
Abstract:
検索者の能力によらず文書を効率良く検索できる文書検索システムを実現する。 データベース文書データが記憶されている文書検索システムを用いて文書検索を行う。第1の文書 データ及び第2の文書データが文書検索システムに入力された後、当該文書検索システムは、第1 の文書データから複数の用語を抽出する。用語の抽出は、例えば形態素解析を用いて行う。次に、 第2の文書データを基にして、抽出した用語に対して重み付けを行う。例えば、第2の文書データ が表す文書に含まれる文章を、第1及び第2の文章に区分する。第1の文書データから抽出した用 語のうち、第1の文章に含まれる用語の重みを、その他の用語の重みより大きくする。文章の区分 は、ルールベース、又は機械学習を用いて行うことができる。その後、重み付けを行った用語を基 にして、データベース文書データの、第1の文書データに対する類似度を算出する。
Information query