DX時代の情報資産管理ポータルサイト

カテゴリ
タグ
  1. TOP
  2. 電子文書管理の基礎知識
  3. 電子文書のファイルと拡張子について解説!

電子文書のファイルと拡張子について解説!

  • LINEで送る
  • このエントリーをはてなブックマークに追加
2025/01/28
電子文書のファイルと拡張子について解説!

電子文書は、紙文書と比較すると比較的新しい媒体のため、法律によって表現や取扱いに多少の相違がありますが、情報技術の発展や環境に伴う変化があります。

本記事では、電子文書のファイルと拡張子についてくわしく解説します。参考にしてみてください。


ファイルとは

コンピューターにおけるファイルとは、データを保存するための論理的な単位の一つ、つまり「データのまとまり」のことです。

データには文字情報、静止画像、動画、音声など様々なものがありますが、コンピューターの中ではデータは全て0か1の「2進数」です。私たち人間(ユーザー)は素の2進数を扱うことはできないので、何らかの形にまとまった集合体にします。それが「ファイル」です。ユーザーは、コンピューターが扱うプログラムやデータを、名前を付けて「ファイル」としてハードディスクなどに保存します。利用する際は、ユーザーやOSは、そのファイル名とファイル名の後ろにつけられる拡張子を頼りにファイルを識別します。

ファイルのイメージ図

ファイルの分類

ファイルは用途や内容、データ形式によって色々な角度から分類できますが、ここでは次の2つの分類を説明します。

a.プログラムファイルとデータファイル

ファイルを利用用途で分類すると「プログラムファイル」と「データファイル」に分類できます。

■プログラムファイル

プログラムは「命令」の集合体です。つまり、コンピューターが行うべき処理を順序立てて記述したものです。このファイルを実行すると、「命令」が連動して様々な処理が開始されます。このため、実行ファイルとも呼ばれます。

Windowsのプログラムファイルの拡張子は主に「.exe」「.com」「.bat」の3種類です。OSによっては実行ファイルであることを示すファイル名の規約が存在します。

■データファイル

データファイルとは、OSやアプリケーションなどの処理の対象となるデータを記録したファイルのことです。例えば、Wordで作成した書類や、Excelで作成したグラフや統計データなどが「データファイル」にあたります。また、デジタルカメラなどから取り込んだ画像や動画、ダウンロードした音楽なども「データファイル」です。

データファイルは無数の種類があり、Windowsの場合、データファイルの拡張子はプログラムファイルの3種類以外のものが該当します。

b.バイナリファイルとテキストファイル

ファイルを構成内容で分類すると「バイナリファイル」と「テキストファイル」に分類できます。

■バイナリファイル

バイナリ(binary)とは「2進数」のことで、データを0または1で表現します。つまり、「バイナリファイル」とは、コンピューターで実際に使用するそのままの形(2進化された形)でプログラムやデータを保存したファイルのことです。

アプリケーションやOSなどのプログラムファイルや、アプリケーションが作成する文書や統計データ、画像、動画、音声などのデータファイル全てがバイナリファイルです。ファイルの構造はコンピューターシステムやアプリケーションによって異なります。

また、特定のエディタ(編集用ソフトウェア)を使ってバイナリファイルを表示することもできますが、内容はビット列のデータ(バイナリデータ)が並んでいるだけなので、中身を見てもその意味は分かりません。

■テキストファイル

テキストファイルは、英数字、記号、漢字/ひらがな/カタカナなどの画面に表示できる文字と、改行やタブなどのいくつかの特殊文字だけで構成されます。数多くのアプリケーションが対応しており、また、異なるコンピューター間でもそのまま使えることが多いので、互換性が高いファイル形式といえます。勿論、テキストファイルも実態はバイナリファイルですが、どのような環境でも同じように扱うことができるという特徴があるため、あえて「テキストファイル」と呼び、それ以外のファイルをバイナリファイルと呼んで区別するのが一般的とされています。

テキストファイルは文字だけで構成されており、書式や装飾情報(フォントの大きさや色、行間、表などの情報)は含みません。そのために、互換性や汎用性に優れている反面、表現力が限られてしまいます。

拡張子とは

拡張子のイメージ図

拡張子とは、ファイルの種類や形式を識別するために設定された文字列のことです。ファイル名の後ろのピリオド「.」に続く3文字前後の文字列で記載されています。ファイルがどのアプリケーションに対応しているのかは「拡張子」で識別します。例えば、「keisan.xlsx」では“xlsx”が拡張子で、Excel用のファイルであることを示します。もしも拡張子に対応するアプリケーションがコンピューター上に存在しなければファイルを扱うことができません。また、拡張子を変更したり削除したりすると、そのファイルを開くことができなくなります。

Windowsの場合はユーザーだけでなくOS自体もファイルの識別に拡張子を使用します。データファイルのアイコンをダブルクリックすると、対応するアプリケーションが自動的に立ち上がりますが、これはOSが行っています。OSはデータファイルの拡張子によって、どのアプリケーションを立ち上げたらいいのかを判断しているのです。

Mac OSも拡張子はありますが、Mac OSは拡張子ではなく他の情報でファイルを識別しています。このようにOSによってファイルの管理方法は異なります。

なお、拡張子は既定では表示されていません。必要に応じて拡張子を表示します。拡張子を表示するには、Windows11では、初期設定では非表示になっているため、[スタートボタン]を右クリックし[エクスプローラー]を開き、[表示]内の[表示]を選択します。[ファイル名 拡張子]にチェックを入れて表示設定が完了します。

ファイル形式とは

ファイル形式とは、データをファイルに格納するときの記録形式(方法やルール)のことです。映像、画像、音声を始め、ディスクに保存されるファイルは、作成したソフトウェアや用途などによって表現方法や構造が異なるため、様々なファイル形式があります。

一般的に表計算などのアプリケーションのファイル形式は独自のものが多く、データを利用する際はそのファイル形式に対応したアプリケーションを使用する必要があります。一方、テキストファイルやBMP、JPEGなどの画像ファイルのように、多くのアプリケーションで扱うことができる汎用性の高いファイル形式もあります。ファイル形式は、ファイル名の最後に付けられる拡張子で識別できます。

まとめ

本記事では、電子文書のファイルと拡張子について解説しました。拡張子は、テキストや画像、音声・動画など様々なファイルの形式を識別するための要素です。誤った拡張子で保存すると読み込めないデータとなってしまい、大切な電子情報が失われる可能性があります。

文書保管、文書のデータ化など、文書管理にまつわるコンサルティングやアウトソーシングをご検討の際は、文書管理のプロフェッショナル、日本レコードマネジメントまで気軽にご相談ください。

関連キーワード

電子化 電子文書 電子文書管理