3D写真計測のアーカイブを考える
Archival Strategy for 3D Photogrammetry in Archaeology and Cultural Property Management
はじめに
考古学研究、埋蔵文化財発掘調査、博物館収蔵資料のデジタルアーカイブ化等において、3D写真計測(フォトグラメトリ)の導入がますます増えている(野口2022, 2023)。2024年3月時点で主流の方法はた多方向から撮影された画像中の特徴点から3D空間上の撮影位置を復元し、それによって得られる複数のステレオペア画像から深度情報を取得、形状(ジオメトリ1))を構築するSfM-MVS法2)である。Agisoft Metashape3)、Epic Games RealityCapture4)など、市販の一般向けPCで使用可能な商用ソフトウェア・アプリケーションの他、Polycam5)、RealityScan6)などのスマートフォン用アプリでも実行できる。
3D写真計測は、専用の計測機器を必要とせず、基礎的な写真撮影の知識があれば十分な成果が得られる。また、入力写真画像を利用した高精細なカラーテクスチャーが取得可能である。このため、立体的な形状を有し、また色情報も重視される物質資料の計測記録に適している。
一方で、最終出力としてのジオメトリやテクスチャのデータだけでなく、入力画像をあわせると全体のファイル数とデータサイズが膨大になる場合もあり、データ保存、成果のアーカイブをどのように行うべきかについて課題が残る。
本稿ではこの点について、考古学デジタルデータアーカイブの一般的原則(Archaeology Data Service & Digital Antiquity 2011, 野口・Yanase・高田訳2022:以下、ADSガイドと略記)7)にもとづいて基本要件を整理した上で、Agisoft Metashapeを使用する場合を例に、ソリューション案を提示する。なお、作業手順とそれを示す用語、派生するファイル形式などに異同はあるが、基本的に他のPC用ソフトや、入力データの書き出しが可能なスマートフォン・アプリにも適用可能なものである。
1.考古学・文化財記録データのアーカイブ戦略
デジタル化された考古学・文化財記録データのアーカイブ戦略の中で、どのデータを保存対象として選択するかについて、ADSガイドは「データ変換のポイント(PIP: Preservation Intervention Points)」を、保存のための「介入」の重要なタイミングとして提示している。PIPは、連続する作業手順のさまざまな局面に設定可能であるが、原則として、それ以前の状態に遡ることが困難な大きな変更が加えられる時点と考えることが適切である8)。
例えば、同一の入力と処理パラメーターにより再現可能な出力データの作成はPIPとしての優先順位は高くない。入力データとパラメーターが保持されていれば、くり返し再作成可能だからである。逆に、再現可能な過程の入力データが生成・出力されるタイミングはPIPとして優先順位が高いということになる。これには、記録が全くない状態から初めて記録が作成されるタイミングも含まれる。
一方で、随時編集や変更が加えられる作業途上のデータは、あくまで一時的な状態として、アーカイブ、長期の保存の必要は無いと考えることができる。これには、一つのソフトウェア・アプリケーション上で連続的な作業が行われる場合だけでなく、複数のソフトウェア間で派生的、または循環的に作業が継続される場合を含む。本稿ではこの状態を「アクティブ・フェイズ」と定義し、作業が一端完了してデータが事実上の凍結(コールドスリープ)された状態を「アーカイブ・フェイズ」と定義する。
3D写真計測における有効なアーカイブ戦略を決定するにあたって、上記に沿って工程と取得・生成データを把握、整理し、優先順位を検討、PIPを決定する必要がある。またその際の対象データとファイル形式も検討する必要がある。その概略は、図1・2の通りである。詳細は次節にまとめる。
図1 3D写真計測の標準工程と取得・生成データの概要
図2 標準工程におけるデータの整理
2. 3D写真計測の基本工程と取得・生成データ
2-1 Metashapeの標準工程と取得・生成データ
Agisoft Metashapeを利用する3D写真計測の標準工程と取得・生成データは以下のとおり。なおここでは各工程の意味、作業内容や設定条件については触れない。
1 写真撮影(図3) ※ほぼ全てのケースで以下は同時に取得される
図3 3D写真計測における写真撮影の例
1.1 RAW画像(拡張子はカメラによる)
1.2 JPEG画像(.jpgまたは.jpeg)
1.3 メタデータ(Exif情報) ※ほぼすべてのケースで1.1、1.2に付属する
以下、2~6はMetashape上で一貫して連続的に行う、SfM-MVSの工程である。
2 写真のアップロード
2.1 サムネイル画像(.jpg)
3 写真のアラインメント(SfM)
3.1 点群(タイポイント、プロジェクトアーカイブとしてPLY形式、任意の点群データ形式にエクスポート可)
3.2 カメラ(カメラ位置、.xmlまたは.txtにエクスポート可)
4 モデル構築9)
4.1 深度マップ(プロジェクトアーカイブとして.exr形式10)、深度(depth)マップ・拡散(diffuse)マップ・法線(normals)マップを任意の画像形式にエクスポート可:図4)
図4 深度マップ・拡散マップ・法線マップ
4.2 メッシュ(プロジェクトアーカイブとしてPLY形式、任意のメッシュモデル形式にエクスポート可)
5 ポイントクラウド構築(オプション)
5.1 ポイントクラウド(高密度クラウド、プロジェクトアーカイブとしてPLY形式、任意の点群データ形式にエクスポート可)
6 テクスチャー構築(図5)11)
図5 テクスチャー構築による拡散マップ・法線マップ・オクルージョンマップ
6.1 拡散(ディフューズ)マップ(プロジェクトアーカイブとしてTIFF形式、任意の画像形式にエクスポート可)
6.2 法線(ノーマル)マップ(同上) ※オプション
6.3 オクルージョン(occlusion: 遮蔽)マップ(同上) ※オプション
7 オルソモザイク構築 ※オプション、Professional Editionのみ
7.1 オルソモザイク画像(プロジェクトアーカイブとしてTIFF形式、任意の画像形式にエクスポート可)
以下、8~9は、モデル作成の過程で必要に応じて行われるものでSfM-MVS工程の一部である。
8 マスク(任意の画像形式) ※オプション
9 マーカー検出または設定と座標入力 ※オプション、Professional Editionのみ
9.1 マーカー(.xml)
9.2 座標
以下、10~11はSfM-MVSの結果にもとづく派生成果物で、Metashapeからも出力可能であるが、多くの場合、サードパーティーソフトで作成・編集される。その際には、標準的な互換形式(.obj、.ply、.fbxなど)の頂点カラーまたはカラーテクスチャーを有するメッシュモデルが利用されることが多い。
10 オルソ画像(任意の画像形式)
11 動画(任意の動画形式)
その他、Metashapeから出力した点群、メッシュにより、サードパーティーソフトを用いて半截図、断面図、円筒(円錐)展開図等、様々な派生成果物を作成・編集することが可能である(野口ほか2024)。
2-2 Metashapeプロジェクトファイルの構成
XMLによるプロジェクト記述ファイル(.psx:図6)と、データおよびパラメーターをアーカイブする同名のフォルダ(.files)として構成されている。なおMetashapeでは、解析処理に用いた画像をプロジェクトファイル中に保存しないため、.psxと.filesの他に、画像アセット一式がないとプロジェクトを開いて、処理を継続または再現することができないことに注意する必要がある(図7)。
図6 Metashape .psxファイルの内容(例)
図7 Metashapeプロジェクトの構成例(画像は一部のみ)
ネイティブ形式とは、個別のソフトウェア・アプリケーションに最適化された専用形式であり、処理過程のパラメーター等のメタデータを含むため作業の継続性、再現性が高い。圧縮効率や読み込み・書き込み速度の点でも優れている場合が多い。一方で、特定のソフトウェア・アプリケーションでのみ開くことができるものなので、ライセンスが必要であったり、またソフトウェアやOSの更新により利用できなくなるリスクがある。
Metashapeでは、データ本体をネイティブ形式ファイル内にバイナリで保存するのではなく外部にアーカイブしている(図8)ので、Metashapeが無くてもサードパーティーのソフトウェアにより読み込むことはできる。またMetashape上からは、「ファイル」メニューの「エクスポート」から任意の互換形式に書き出すことも可能である(ただしマスクと深度マップは写真画像を右クリックして表示されるメニューからエクスポートまたはレンダリング)。なおこれらの手順で取得した個別データから、プロジェクトにおける処理の継続や再現はできない。
図8 Metashape .files内のデータフォルダ(例)
3. PIPと優先順位付け
3-1. 写真撮影
対象に直接はたらきかける過程であり、3D写真計測の起点である。ただしLiDARスキャンと異なり、ここで取得される画像それ自体は3Dデータではない。記録保存としての埋蔵文化財発掘調査における遺跡・遺構のように対象が残らない場合、対象の状態が経時的に変化する場合、また災害等で対象が損傷や滅失する可能性等、再び同じ条件で実施することが困難か不可能になることを想定して、最優先のPIPと位置付ける。
3-2. SfM-MVS
写真画像を3Dデータに変換する過程である。Metashapeをはじめとする専用のソフトウェア・アプリケーションでは一貫して連続的に行うことが可能であり、途中経過と結果はネイティブ形式のプロジェクトファイルとして保存される。Metashapeの場合は2-2の通り、XMLで記述されるプロジェクトファイルとデータアーカイブフォルダからなる。
ネイティブ形式は個別のソフトウェアに最適化されており、処理過程のパラメーター等を保持できるので、継続中の作業を保存するのに適している。従ってアクティブ・フェイズにおいては、ネイティブ形式で保存することが強く推奨される。
また前述の通り、Metashapeのプロジェクトはデータをサードパーティーのソフトウェアにより読み込み可能な状態でアーカイブしている。プロジェクトとしては入力写真画像とセットで保存されることが推奨されるので、全体として、アーカイブ・フェイズにおけるバックアップにもなる。
なおこの工程の成果は、点群、メッシュ、オルソモザイク画像など、派生成果物作成の入力データとなるかたちで出力、保存される。
3-3.点群・メッシュの編集・二次的加工
3D写真計測に限らず、3D計測データの最大の利点は、デジタルデータとして、同一の入力、同一のパラメーターによる処理の結果が同一になることである。従って、互換性の高い標準形式で保存された3D計測データさえあれば、高い再現性を持つ多様な出力を繰り返し取得できる。そこで、互換性の高い標準形式を選択して書き出し、保存することが重要になる。そのためのファイル形式については次節でまとめる。
これに対して、編集や二次的加工により得られる隠す派生的成果物とその作成過程は、PIPとしての優先順位は高くない。必要に応じて適宜保存するということになる。
4. 長期保存のためのファイル形式の選択
4-1.入力写真画像
多くのデジタルカメラは、撮影時にカラーバランス等を調整したJPEG画像を保存する。露出やフォーカスが適切である限り、SfM-MVS法による3D写真計測の処理にはこのJPEG画像で十分である。ただし、画像サイズは可能な限り大きく、画質はできるだけ高い(または圧縮率はできるだけ低い)設定にする必要がある。
RAW画像は、カメラの外部で露出やカラーバランスを詳細に調節できるという利点がある。露出不足などを後から補正する際に、RAW画像は有効である。一方で、RAW画像は一般にJPEGの2~6倍のファイルサイズとなり、保存の際にストレージ容量を圧迫する。RAWから現像処理した画像を、高画質を保ったままTIFF形式等で保存すると、全体のデータサイズはさらに増加する。
これらのうちどれを保存するべきかは一概に決めることはできない。JPEG画像により十分な成果が得られた判断される場合は、使用したJPEG画像をアーカイブ対象とすることが可能である。ストレージ容量に余裕がある場合は、RAW画像をバックアップとすることで、将来的な再処理に対応できるかもしれない。
RAW画像を現像処理したTIFF形式等の画像により解析処理を行なった場合、使用したTIFF画像を保存する替わりに、RAW画像と現像処理のパラメーターを保存することも可能である。いずれにしても、アーカイブ全体の持続可能性を考慮して判断する必要がある。
4-2. 3D計測データ
互換性の高い標準形式として、2024年3月時点ではOBJまたはPLY形式が推奨される。とくに長期保存においては、バイナリ圧縮を行なわないASCII形式(プレーンテキストとして表示可能な形式)を採用するべきである。
FBX、GLB、USDZ形式などは、3DCG、3Dアニメーション、およびxRコンテンツの作成において有効であり、かつ後二者は圧縮効率も高いため、インターネットを通じた公開共有にも適している。OBJまたはPLY形式のデータをアーカイブフェイズにおける保存形式とした上で、二次利用におけるアクティブフェイズのデータとして、これらの形式を積極的に利用すべきであろう。
4-3. 出力画像等
従来の写真画像は、銀塩フィルムであってもデジタルであっても、対象物だけでなくその周囲の環境光、その反射等、周囲の状態も含む記録であった。これに対して3D写真計測データでは、対象の3D形状はジオメトリとして、色や質感はカラーテクスチャとして再構成される。その上で、環境光と、それに対する遮蔽、屈折、反射等が、物理ベースレンダリング(PBR: Physical Based Rendering)によってシミュレートされる。それらは外部パラメーターとして付加的に入力されるものであり、計測記録そのものには含まれない。
PBRにもとづく出力そのものではなく、元となるデータとパラメーターがまずアーカイブ対象となる。
5. 追加的事項
ADSガイドでは、長期保存用の記憶媒体を含めたデータの適示の移行(マイグレーション)の重要性が指摘されている。2024年3月の時点で、この形式、この媒体を選択すれば将来にわたり間違いなく保存し続けることができるというソリューションは無い。この点がデジタルデータの脆弱性として指摘されることもあるが、しかし、紙(印刷物)や銀塩フィルムであっても、適切な保存環境を保ったうえで、媒体の耐用年数を超える前に複製・転写する必要がある点で根本的な違いはない。むしろ劣化の無い複製が可能なデジタルデータは、くり返し頻繁にコピーし、それらを並列・分散保管できるという利点がある。
この利点を最大化できるようにアーカイブ戦略を組み立て、必要なデータを保存するべきである。
おわりに
本稿の内容は2023年月日にオンラインで開催した、考古学・文化財のためのデータサイエンス・サロンonline第41回「フォトグラメトリデータのアーカイブを考える」xx) に準拠しているが、一部修正、加筆している。
【注】
1) geometry。本来の意味は幾何学または幾何形状。形状(shape)、サイズを含む形態(form)、相対的な位置や空間上の特性を指す。3DCG・モデリングでは、立体形状・形態を構成する頂点、線分(曲線を含む)、面(局面を含む)、それらの幾何学的特徴を表す座標値や関数、数式、各種パラメーターなどデータの組み合わせを意味する場合もある。本稿では、色、質感や、反射、陰影などの要素を除いた形状・形態要素を指す語として使用する。
2) SfM (Structure from Motion)は、画像上で抽出される特徴点を複数画像間でマッチング、カメラ位置とタイポイント(画像間の接合点)を3Dで再構成する手法。MVS (Multi-View-Stereo)は、複数のステレオペア画像にもとづき詳細な3D形状を復元する手法。多視点ステレオ(織田2016, 布施2016, 金井2021)。
3) https://www.agisoft.com/
4) https://www.capturingreality.com/
5) https://poly.cam/。iOS版、Android版のほかWeb版もある。
6) https://www.unrealengine.com/ja/realityscan。iOS版、Android版がある。
7) とくに明示しない限り日本語訳版を参照している。
8) ロールプレイングゲーム(RPG)などにおけるセーブポイントと同等であると考えれば良い。
9) 2.0以前のバージョンでは「高密度クラウド構築」「メッシュ構築」に分かれていた。2.0以降では、深度マップからのメッシュ構築が標準工程となり、高密度クラウド構築は「ポイントクラウド構築」としてオプションになっている。
10) ILMが開発した高ダイナミックレンジ、ロスレス圧縮、マルチチャンネルの画像ファイル形式。
11) UV座標に展開された画像として出力される。
【引用文献】
織田和夫 2016「解説:Structure from Motion (SfM) 第一回 SfMの概要とバンドル調整」『写真測量とリモートセンシング』55(3): 206-209
金井 理 2021「SfM-MVS技術の動向」『写真測量とリモートセンシング』60(3): 95-99
野口 淳 2022「動向レビュー:文化機関における3 次元計測・記録データの管理・公開の意義と課題」『カレントアウェアネス』351: 18-22
野口 淳 2023「デジタルアーカイブス時代の文化財3次元計測」『日本画像学会誌』62(1): 68-72
野口 淳・上山敦史・津田富夢 2024「第6章第3節 多喜窪遺跡出土縄文土器の3D計測」『多喜窪遺跡調査報告書』国分寺市教育委員会、pp.111-124
布施 孝志 2016「解説:Structure from Motion (SfM) 第二回 SfMと多視点ステレオ」『写真測量とリモートセンシング』55(4): 259-262
Archaeology Data Service and Digital Antiquity (eds.) 2011 A Guide to Good Practice. University of York, UK. / (野口 淳・Peter Yanase・高田祐一訳2022『考古学・文化財デジタルデータのGuides to Good Practice』奈良文化財研究所研究報告第31冊 pp.1-145)