全文検索

データベース

進化する情報検索:フルテキスト検索のススメ

私たちは日々、インターネット上の膨大な情報の中から必要な情報を探し出していますが、その際に「キーワード検索」を利用することがほとんどです。しかし、この従来からの情報検索の方法には、いくつかの限界が存在します。 例えば、ある特定の単語を使って検索を行ったとしても、その単語を含む文書は星の数ほども存在するでしょう。その中から、本当に自分が求めている情報を含んだ文書を見つけ出すことは、砂漠の中で一粒の砂金を探すような困難を伴う場合があります。なぜなら、キーワード検索は、あくまでも単語と単語の一致のみに頼って検索を行うため、文章全体の流れや意味を理解することができないからです。 このため、検索結果が膨大になりすぎてしまい、目的の情報に辿り着くまでに多大な時間と労力を費やさなければならないという問題が発生します。逆に、検索に用いたキーワードが適切でない場合には、検索結果が非常に少なく、必要な情報を見つけること自体が難しいという状況に陥る可能性もあります。このように、キーワード検索は便利な反面、その限界を理解した上で利用する必要があると言えるでしょう。
データベース

全文検索で探す、ウェブの宝探し

- 全文検索とはインターネット上には、ウェブサイトやブログ、電子書籍など、気が遠くなるほどの量の文章データが存在します。その中から、自分の求める情報をピンポイントで見つけるのは、干し草の中から一本の針を探すようなものと言えるでしょう。 そんな時に役立つのが「全文検索」です。例えば、旅行の計画を立てている時に「京都 観光」と検索窓に入力したとします。すると、画面には京都の観光情報に関するウェブサイトやブログ記事がずらりと表示されます。これは、インターネット上に散らばる膨大な文章データの中から、「京都」と「観光」という言葉が両方含まれている文章を、全文検索システムが探し出してくれたおかげなのです。全文検索システムは、ウェブサイトやデータベースなどに保存されている文章データを、あらかじめ細かく分析し、単語ごとに索引(インデックス)を作成しています。この索引は、辞書の語のように、どの単語がどの文章に含まれているかを瞬時に調べるためのものです。そのため、私たちが検索窓にキーワードを入力すると、全文検索システムは作成した索引を使って、膨大なデータの中から目的の文章を素早く探し出すことができるのです。