DX時代の情報資産管理ポータルサイト

カテゴリ
タグ
  1. TOP
  2. 電子文書管理の基礎知識
  3. 情報検索とは?メタデータ検索について解説します

情報検索とは?メタデータ検索について解説します

  • LINEで送る
  • このエントリーをはてなブックマークに追加
2024/01/25
情報検索とは?メタデータ検索について解説します

情報の検索は、皆さんが必要に応じて行っている日常的な行動ではないでしょうか。例えばGoogleやYahoo!などのサーチエンジンで気になるお店を調べることも、iTunesで聞きたい音楽を探すことも、現在ではスマートフォンやパソコンで簡単に行えます。必要な情報を探し出すための「検索」にはどのような種類があるのでしょうか。

本記事では情報検索の手法のひとつであるメタデータ検索について解説します。

メタデータ検索

全文検索とメタデータ検索

コンピューター上で文書検索を実現する方法は、以下の2種類に大別できます。

  • 全文検索
    全文検索は、文書の中身そのものを検索対象とする手法です。【例:GoogleやYahooなどのサーチエンジン】
  • メタデータ検索
    メタデータ検索は、文書の内容そのものではなく、対象文書のタイトルや著者名など、その文書の文脈や背景に関する情報を検索対象とする手法です。【例:図書館の蔵書検索システム】


文書や図書などの情報資源は、それ自体、何らかの「データ」を記録したものです。これに対し、文書のタイトルや作成者名などは、情報資源というデータに関する何らかの文脈、背景を表していると同時に、それ自体も「データ」であると言えます。このような「データに関するデータ」のことを「メタデータ」と呼びます。

全文検索とメタデータ検索にはそれぞれ利点と欠点があります。全文検索では文書の中身そのもの全てを検索することができるようにあらかじめ処理しますが、それは基本的に機械的に処理することが可能で、あまり人手をかける必要がありません(逆に人手をかけていては全文検索の実現は不可能です)。

一方で、全文検索では検索がうまくいかない場合もあります。例えば電子書籍の全文検索システムの場合、その中から夏目漱石の『こころ』を検索しようと「こころ」と入力しても、「こころ」という単語を含む大量の図書が見つかってしまいます。「夏目漱石 こころ」と検索すればある程度は数を限定できますが、『こころ』に関する批評・研究も一緒に出てきてしまうなど、意外と厄介です(GoogleやYahoo!などのサーチエンジンでは比較的簡単に検索できますが、これは後述する工夫が取り入れられているためです)。

一方、メタデータ検索では検索の目的やシステムの利用場面をあらかじめ検討し、検索用のメタデータを整備することで、より効率よく情報を探すことができます。『こころ』であれば、タイトルを対象に検索を行えば良いわけです。その反面、メタデータ検索においては人手をかけたデータの整備が必要であり、整備を怠ってしまうとメタデータ検索は実現できません。

それぞれの利点と欠点を考慮し、どちらを用いるのか、あるいは両方を構築するのかを検討する必要があります。
 

メタデータ検索に求められる要件

メタデータ検索は、従来、辞書のように特定の見出しから情報を探せるようにした冊子体の目録や、情報資源を構成する様々なデータを記述したカードをなんらかの見出し順に並べたカード目録によって実現されていました。しかし現在では、メタデータ検索は、専らコンピューター上で動作するデータベースで実現されています。

構築にあたっては、リレーショナルデータベース(RDB:表形式の複数のデータを関連付けて使えるように管理されたデータベースのこと)の仕組みを用いることが一般的です。多くの場合、情報資源1件の情報を1レコードとし、タイトルや作成者などの情報資源の要素1つずつを1フィールドとするテーブルが作成されます。メタデータ検索システムの目的は、当然、情報資源を検索できるようにすることですが、細かく分けると「集中」と「識別」という2つの機能を満たすことが求められます。

集中

「集中」とは、利用者の検索目的に合致するものとして、どのような情報資源があるかをまとめて(集中して)見せられるようにする機能です。図書の検索を例にとれば、「村上春樹の本が読みたい」とか、「沖縄の歴史に関する本が読みたい」という場合には、その目的にかなった情報資源を検索結果の一覧にまとめて表示する必要があります。言い換えれば、利用者が「集中」して見たいと思いそうな、検索の手がかりとなる項目、上記例でいえば、作成者(村上春樹)、タイトルや主題(沖縄の歴史)を切り出して、データベースのフィールドとして設定しなければなりません。

識別

「識別」とは、検索の結果見つかった情報資源が、利用者にとって必要なものかを判断できるような情報を提示する機能です。電子文書のように本文を利用者が直接確認できる場合には、本文を見れば良いと思うかもしれませんが、検索の結果、提示された文書についていちいち本文を見て中身を確認しなければ判断できないとなれば、利用者にとって負担になります。本文まで見なくとも、できるかぎり検索結果の一覧などに提示された情報から目当てのものかを見分けられるようにするために、一覧に表示する項目もメタデータの中に含める必要があります。

 

まとめ

本記事では、私たちが日頃利用しているインターネットの情報検索や組織内外で利用できるデータベースシステムも含めて、情報を探すことを前提として蓄積、整理された情報であり、その検索性の向上のため様々な工夫が凝らされていることを解説しました。ご参考になりましたでしょうか。

電子文書管理についてお知りになりたい場合は、文書管理に関する様々なテーマや課題についてコンサルティングからシステム開発・運用に至るまで一貫したサービスをご提供し、450社以上の実績がある日本レコードマネジメントへお気軽にお問い合わせくださいませ。