画像の分類手法

個人サイト管理インデックスに戻る

項目記述日:2022/3/5
最終編集日:2023/7/17
ここでは画像の分類手法と題して、デジタルカメラによって撮影されたすべての画像(動画を含む)の分類手法について記述する。

適切な分類がされていなければ、特定の画像を選び出すのが困難な程度に大量枚数が存在することを前提条件としている。数十枚程度の画像であれば、撮影された日時に応じてフォルダ毎に保存すれば足りるだろう。

一連の記述の目的は2つあり、一つは最終編集日時点でどのような基準により画像を分類整理しているのかを明確にするための自分自身を含む覚え書きであり、もう一つは終末処理のような自分以外の誰かが画像検索する場面において、膨大な枚数の中から実際に必要な画像を探し出す指針を与えることにある。

最初に一般的な分類手法について言及し、次に現時点で実際に援用されているカテゴリ分類について記載している。
《 カテゴリ分類とエリア分類 》
画像の分類法として、何を基準におくかで異なる手法が存在する。何の題材を撮ったものかを基準とするのがカテゴリ分類、何処で撮影したかを基準とするのがエリア分類である。

花を撮影する趣味がある人なら、種別にフォルダ分けして保存するだろう。この種別がカテゴリとなる。別の場所にある同種の花を撮影したなら、両者を区別するために何処で撮影したかの二次的要素を追加する。撮影場所を考慮しないなら、撮影対象ごとに区分されたフォルダへ収録するだけで足りる。

場所を移動しながらその地域にあるいろいろな花を撮影するなら、何処で撮ったかの情報に重点を置きたいかも知れない。この場合、撮影場所した市町村や更に細分化されたエリアの数だけフォルダを作成し、そこへ分類すると後から探しやすい。単一エリアで大量の写真を撮ったなら、当該エリア配下に花の種別のサブフォルダを作成するだろう。

カテゴリ・エリアの分類手法は、切手収集におけるトピカル・コレクションとゼネラル・コレクションに些か類似している。
【 どちらの分類手法を援用するかについての模索 】
当サイトで記事に使用されている画像は、この記事を編集追記する現時点で原典ファイルが40万枚を超えている。ここまで膨れあがる前から、早い段階で適正な分類を行わなければ自分自身でも欲しい画像を探すのが困難になると予想していた。

エリア分類を導入した場合、市内に限定するなら既に規定されている地区(旧呼称は校区)の数だけフォルダを作成し、そこで撮影されたもののうち何を撮ったかを二次的に分類するのが妥当である。各校区に郷土史研究会が存在し、校区単位で郷土マップが作成されてきた。これに倣うならエリア分類しておけば、既存の郷土マップを元に物件を追加しアップデートする作業が容易になる。

カテゴリ分類を導入した場合、同種の画像を探しやすい半面、同じ場所にある異なるカテゴリに属する画像が別のフォルダへ分散収録されてしまう欠点がある。この点ではエリア分類の方が好都合なのだが、同種の画像を探すために別地区のフォルダを開いて探す手間が要る。そして(これが最終的な判断材料となったのだが)河川や道路のように複数の地区を跨ぐ対象物の分類が困難となる欠点がある。

現在のような活動が加速し始める2009年頃までは撮影枚数自体が少なかったため、西暦年を元にしたフォルダへ全部を収録する時系列分類を採っていた。2009年より撮影枚数が爆発的に増加し、単一の西暦年フォルダに全部詰め込むと後で探すのが大変だった。このときエリア分類ではなくカテゴリ分類を採用したのは、初期の撮影対象がダムや工業用水、用水路に限定されていたからである。殊にダムは県内に分散しているので、エリア対象だと市外で殆どダムの数だけフォルダを作成してダム以外の画像も収録することとなり、分類法として現実的ではなかった。

後に活動範囲を市内に絞り込む代わりに他の題材も撮影するようになってからは、カテゴリ分類の優位性が明白になった。同じ物件を何度か訪れて撮影し、良い画像が採取できたとき品位が劣る画像を削除する作業も、カテゴリ分類でなければ比較検討ができない。このような背景により、初期の段階からカテゴリ分類を採用し、撮影対象が拡張するにつれて必要なカテゴリを追加設定する形で現在に至っている。
【 こうもり問題について 】
画像をカテゴリ分類するにしても、なお判断が難しい場合がある。いくつかのカテゴリに跨がる物件の写真を何処に保存するかという問題である。例えば厚東川ダムの撮影を行うと、アングルによっては配下にある厚東川発電所厚東川1期工業用水道が写り込む。ダムと工業用水道は10の物件カテゴリのうち利水に含めているが、厚東川発電所は電気カテゴリである。

コウモリは鳥とも獣ともつかぬ中間的な外観をしていることから、どっちつかずの態度をとって巧く振る舞う喩え(寓話の卑怯なコウモリ)に登場する。実務的な問題として、大量に存在する物品やデータをAとBのどちらに分類整理すべきか迷う場面があり、こうもり問題と呼ばれている。

画像がコンテンツとなるホームページの記事では、早期にダム、工業用水道、河川などのフォルダを適宜作っていたので、概ね直感的に理解できるサブディレクトリに当該物件の記事が見つけられる。画像はドキュメントよりも遙かに絶対数が多く、10個のカテゴリを決めた後で配下にセクションを作って分類したので、先述の例では厚東川発電所の写真がダム、電気、河川の主要3カテゴリの配下にあるサブフォルダに散らばっている。何処へ保存するかは、撮影した直後にフォルダ移動するときの判断である。一貫性がないもののこの問題は避けられないものと認識している。

スマホで撮影された画像は、能動的に整理しない限り時系列に並べられる。撮影したのは間違いないのに、誰かにその写真を見せようと延々ワイプし続けたものの見つからず諦めたことは多くの人が体験しているだろう。当サイトの画像整理法は、この中間的手法を採っている。撮影しPCに取り込んだ時点である程度の時間を使って大まかな整理をしておく代わりに、当該画像が保存されている場所を有限箇所に限定する方法である。

厚東川発電所は電気カテゴリのサブフォルダに保存されている可能性が一番高く、部分的に写り込んでいるものなら利水カテゴリの厚東川ダムや工業用水道のサブフォルダにもあるかも知れない。しかし史跡カテゴリや公園カテゴリに入っている可能性はほぼゼロであるから、これだけでも画像ファイルを探す場所を絞り込むことができる。実際に探す場合はまず電気カテゴリの厚東川発電所フォルダを開き、目的のものがなければ更に利水カテゴリの厚東川ダムや河川カテゴリの厚東川フォルダをあたることになるだろう。
《 現在の画像分類 》
カテゴリ分類を援用していると言っても、撮影されたすべての画像にそのまま適用されるわけではない。規定された自己所有のデジタルカメラ(以下「カメラ」と略記)で撮影された画像は、最初に以下の3系統に分類される。
a. 物件(定義済み)
b. 非物件(素材、手順の再現、説明用画像、イベントや会合の記録画像)
c. 接写画像(資料の映像化、物品の接写、人物など個人情報に係る記録)
このうち a. 区分に対しては後述するカテゴリ分類を適用している。即ち所在地が特定される場所で実体のある被写体を撮ったものが対象である。厳密な物件の定義についてはリンク先を参照されたい。
物件の画像分類
物件を撮影した画像は \Graphics フォルダ配下に10の主要カテゴリを元に分類されている。すべての画像が完全に精査されているわけではないが、ここに保存された画像は終末処理を経て営利を目的としない利用が可能になることが明言されている。
非物件の画像分類
b. の非物件とは、上記の物件以外の被写体をカメラ撮影した画像である。ただし素材以外の接写画像で他者に著作権があるものは除く。物件を構成する素材や一般的な物品のような有形物、作業手順の再現や説明用に採取されたモニタ画面などを撮影した画像がある。日常生活の記録目的で撮影された人物や会合の様子の記録、物件の記録目的ではないスナップ写真もここに含まれる。

ホームページやSNS、ブログなどに掲載する画像素材として使われることが多いため、これらの画像は \Homepage\Graphics フォルダ配下に保存している。a. 分類の物件画像と同様に基本的には終末処理後の利用が可能だが、個人情報などの理由で共有・公開すべきでない画像は \個人記録 サブフォルダへ移している。個人記録サブフォルダにある画像は、終末処理の対象外である。これ以外でも2010年以前に撮影された画像では一部に公開不可の写真が含まれていることに注意を要する。

以上の2つに属するすべての画像は、所定のファイル名命名規則によりリネームされ、撮影枚数も個別に日々記録されている。非物件の画像を外しているのは検索を容易にするためであり、物件の画像に比べて重要性が低いというわけではない。
【 接写画像 】
c. の接写画像とは、絵図や書籍など他者に著作権があるものを自己資料向けにカメラ接写した画像と、物品の記録を目的に接写された画像である。以前は b. 非物件に含めていたが、大量枚数になることが多くカメラ撮影された画像総数に含めるのは相応しくないため別分類としている。

撮影された画像は物件・非物件画像と同様に一旦ファイル命名規則に従い処理されるが、後に適切なファイル名に変更される。例えば書籍ではページ数に直される。このような画像は順序や配列が重要であり、撮影年月日はファイル名に反映されない。(ただしExif情報で撮影年月日は分かる)

一連の画像は \Imported フォルダに保存されている。書籍を自炊した画像は books サブフォルダ配下に書籍名ごとに保存されている。他者が撮影した印画紙ベースの写真を自前のカメラで接写した画像も同様である。これらの画像ファイルは撮影枚数の管理から外されている。

a. や b. に属する画像を元にリサイズやトリミング、書き加え、埋め込みなどの作業を経て生成された二次的画像データも pics サブフォルダに保存されている。ただしホームページ掲載用として作成された写真は、ドキュメントと共に \Homepage\ubemaniacs のローカルフォルダへ置かれるので重複して保存はしていない。

他者が撮影してSNSなどから送られた画像やネットからダウンロードした画像も、主要なものは pic サブフォルダに保存されている。したがって Imported フォルダにはカメラ撮影以外の画像が混じっている。そもそも他者が撮影した画像を保存する目的で Imported フォルダが作成されており、撮影した画像枚数を圧縮するために内容に応じてカメラ撮影した画像も後付けでここへ移動することにしている。

書籍や画像のような実体あるものを接写した画像や他者から送られた画像は再取得が可能であり、この点で物件・非物件画像に比べて明らかに重要度は低い。ただしバックアップ対象フォルダには含まれている。
《 バックアップ時の負担軽減を目的とした変更手順 》
追加・削除・移動されたすべての画像ファイルやフォルダは、その後のバックアップ作業で反映される。バックアップではミラーリング動作を指定しているので、常にPC側と同じ内容となるように変更される。

画像ファイルの追加・削除は一定量に収まるが、移動は既存のファイルを削除して別の場所へ書き直すためバックアップ作業において大きな負担となる。例えば以下のような事例が該当する。
(1) フォルダ単位でのカテゴリ間の移動。
(2) フォルダ名の変更。
(3) サブフォルダ作成による再構成。
カテゴリ間の移動は、フォルダに含まれている画像総数が多いと負担がかかる。最近では自炊書籍や郷土資料などを非物件画像から接写画像へ変更した事例がある。フォルダ名の変更は、道路カテゴリのサブフォルダで半角スペース文字を含めていた事例がある。従来は路線番号と路線名の間に半角スペースを入れたフォルダ名にしていた。半角スペースは慣習的にデリミタとして使われており、ファイル名やフォルダ名に使うと問題が起きる可能性があることを考慮して、すべてアンダーバーに置換した。

このような作業を一度に行うとバックアップ作業に時間がかかるため、画像枚数が多かったりフォルダ名のごく一部のみを書き換える場合はバックアップツールを介さずに直接該当するフォルダを移動したり変名したりしている。

同一物件を何度も訪問したり道路のような線的要素を持つ物件では、撮影枚数がしばしば膨れあがる。比較してより写りの良い画像に差し替える作業が困難になるので、いくつかの区間に分割し再度仕分けしている。
出典および編集追記:

1.「Wikipedia - こうもり問題

トップに戻る