電子文書のアーカイブズと長期保存
MLA連携という言葉があります。博物館(Museum)、図書館(Library)、文書館(Archives)の間で行われる種々の連携・協力活動を示す言葉ですが、博物館と図書館に身近に感じていても、文書館、資料館とも呼ばれるアーカイブズについては、あまり馴染みがないかもしれません。
アーカイブズには、長期に渡る資料保存の使命があります。中には永久保存を義務づけられた資料もあります。保存期間により、オリジナルが紙文書の場合と、電子文書の場合とでは、大きな違いが生じます。
本記事では、特に電子文書の長期保存について解説したいと思います。
アーカイブズとは
アーカイブズ(Archives)は、アーク(Arc)という櫃を意味するラテン語に由来していて、「大切なものを保管する」といった意味があります。現在では、まず組織または個人がその活動により生み出す記録のうち、重要なものを将来のために保存する施設という意味で使われるのが一つ。2つ目として、資料そのものも指す言葉になっています。代表例として国の中央省庁の重要な文書を保存するためには国立公文書館があり、地方自治体や大学や企業でも同様の目的でアーカイブズの設置が進んでいます。
ところで、なぜアーカイブズが必要なのでしょうか。例をあげて説明しましょう。
2011 年 6 月 25 日に被災自治体の長や有識者から成る政府諮問機関の「東日本大震災復興構想会議」が発表した「復興への提言」では、「復興構想 7 原則」のうち「原則 1」として、「大震災の記録を永遠に残し、広く学術関係者により科学的に分析し、その教訓を次世代に伝承し、国内外に発信する。」としています。これら災害情報を公的な記録として保存して後世に伝えていくことは、文化的な行為としてとても有意義なことです。
企業のアーカイブズの例も紹介します。老舗和菓子屋「とらや」には「虎屋文庫」というアーカイブズがあります。ここでは、企業経営の資料も保存しますが、最も大切に収蔵しているのは、菓子の木型や意匠図の帳面です。企業アイデンティティの根幹であるそれらは、次世代を担う経営者や社員達にとって、まさに宝物なのです。
では、アーカイブズは具体的にどのような資料を保存しているのでしょうか。
アーカイブズの収蔵資料のほとんどは現状、紙の文書です。しかし、アーカイブズは紙の文書しか受け付けないわけではありません。写真、音声映像記録、電子文書(データベース、ウェブサイトのHTMLデータなど)といったものも含まれます。先の和菓子屋「虎屋文庫」の例では、菓子の木型なども収蔵していました。
アーカイブズが設置されると、その存続にあたって直面する課題として、物理的な問題としての保管スペースの確保、オリジナルの紙文書の経年劣化への対応などが挙げられます。さらに今後取り扱う量が増えると予測される電子文書の長期保存についても対応していく必要があります。
アーカイブズと電子文書
長期保存の課題と対策
アーカイブズ資料が電子文書の場合、紙文書とは異なり、手に取って保存状態を直接確認するようなことはできません。よって、長期に渡る保存期間中に内容が壊れないような保存方式を検討・導入する必要があります。
電子文書を長期保存する際には以下のリスクがあります。
- 文書を作成したソフトウェア及びハードウェアの陳腐化
- 記録媒体や技術の陳腐化、記録媒体の寿命の短さ(不確かさ)
- 機器の故障や操作ミスによる記録の消失の可能性
それらの対策としては、
バックアップ
磁気テープやハードディスクなどの電子媒体にデータの複製を保存するだけでなく、紙にプリントアウトしたりマイクロフィルムに記録したりすることも考えられます。なお、バックアップした媒体(データ)は、元資料と同一場所に保存しないことも大切です。「マイグレーションデータ移行」・「データ変換」を一定年限で実施します。記録媒体の寿命は短く、対応するハードウェアの寿命も長くありません。そのため、データを継続的に新しい記録媒体へ移行する必要があります。
- ※「マイグレーション」については、本ブログ記事「電子文書の長期保存・4つのリスクと7つの対策」でも解説していますので、ご参照願います。
エミュレーション
他の環境上で本来の動作環境を疑似的に再現するもので、例えば、Windowsの最新バージョン上に旧バージョンの環境を疑似的に再現することで、旧バージョン対応のソフトウェアを実行することができるようになります。
長期保存フォーマットに変換
長期保存のために、長期保存フォーマット(PDF/Aなど)へ変換を実施します。
メタデータの保存
電子文書の長期保存にあたってはメタデータを作成します。メタデータとはそのデータを表す属性や関連する情報を記述したデータのことで、文書データであれば、タイトルや著者名、作成日などがそれにあたります。メタデータも“電子データ”なので、本体の電子文書同様に真正性、完全性、アクセス可能性、理解可能性、処理可能性、潜在的な再利用可能性が担保されなければいけません。保存に関するメタデータ1)や技術的なメタデータ2)については、単に保存するだけではなく、状況に応じた更新も必要となります。例えば、マイグレーション後の保存媒体や保存場所、再生技術、管理責任者などの長期保存に関する情報を追加する必要があります。さらに、メタデータを電子文書本体と分けて保存している場合には、データ変換などによって、これらの関連性が失われないよう注意が必要です。
- 1)保存メタデータ:受け入れ時の状態や保存行為として情報資源に対して行った処置を記録したメタデータ
- 2)技術メタデータ:電子文書を再生する際に必要となる技術的な情報を記したメタデータ
エッセンスの保存
電子文書には紙の文書にはない構造や機能など(ハイパーリンク構造や関数、マクロ機能など)があるため、紙の文書に比べて、どこまでをアーカイブズするのか記録の範囲を特定するのが困難といえます。また、ハイパーリンク構造や関数、マクロ機能などの全てを長期にわたって安定的かつ効率的に保存することは、きわめて困難な上、たとえ保存できたとしても、将来的にそれを閲覧するソフトウェア自体が入手できなくなったり、それを動かすためのOS環境が失われたりしているかもしれません。
電子文書を長期保存するにあたっては、構造や機能を単に再現するための情報までも保存するのではなく、記録としての価値を維持するのに不可欠な「エッセンス」、つまり、“その文書の内容と作成のコンテクスト(背景、状況、環境)”を保存することが適切といえます。何がエッセンスであるかという判断は、対象となる文書のフォーマットにも依存しますが、例えば、文書作成ソフトや表計算ソフト、プレゼンテーションソフトで作成される「電子文書」については、文書の「見た目」がエッセンスと考えられます。
文書作成ソフトや表計算ソフト、プレゼンテーションソフトで作成された電子文書は、元のフォーマットではなく、長期保存フォーマット(PDF/A)に変換してからアーカイブズするのが一般的です。それは、PDF/Aが「見た目」を忠実に保存でき長期保存後も支障なく復元可能なフォーマットであるため、エッセンスだけを保存するのに適しているためです。
まとめ
本記事ではアーカイブズおける電子文書の長期保存に関して基本的なこと解説しましたが、参考になりましたでしょうか。本記事も含め電子文書管理全般、あるいは詳細についてお知りになりたい場合は、文書管理に関する様々なテーマや課題についてコンサルティングからシステム開発・運用に至るまで一貫したサービスご提供し、450社以上の実績がある日本レコードマネジメントへお気軽にお問い合わせくださいませ。