デジタル技術による文化財情報の記録と利活用
>
6 号
>
文化財データリポジトリと文化財オンラインライブラリーの公開 :データ再利用性および論文アクセス向上のためのプラットフォーム
文化財データリポジトリと文化財オンラインライブラリーの公開 :データ再利用性および論文アクセス向上のためのプラットフォーム
高田 祐一 ( 奈良文化財研究所 )
Takata Yuichi
高田 祐一
2024
「文化財データリポジトリと文化財オンラインライブラリーの公開 :データ再利用性および論文アクセス向上のためのプラットフォーム」
『デジタル技術による文化財情報の記録と利活用』
遺跡地図・3D・GIS・モバイルスキャン・デジタルアーカイブ・文化財防災
https://sitereports.nabunken.go.jp/online-library/report/45
本稿では、文化財分野における報告書や論文などの調査研究成果の電子公開に関する2つのシステムを紹介する。
1つ目は「文化財データリポジトリ」で、画像、図面、3Dデータなどのデジタルデータを登録・公開するためのプラットフォームである。検索機能やデータ再利用性の向上、業務効率化などが期待される。
2つ目は「文化財オンラインライブラリー」で、論文や報告書の本文テキストを登録・公開するWebサイトである。Webページ化によるアクセス性の向上、コンテンツの再利用、組版コストの削減などのメリットがあると述べる。
これらのシステムは、調査研究成果のオープンアクセスを促進し、FAIR原則に基づくデータ公開を実現することを目指している。
1つ目は「文化財データリポジトリ」で、画像、図面、3Dデータなどのデジタルデータを登録・公開するためのプラットフォームである。検索機能やデータ再利用性の向上、業務効率化などが期待される。
2つ目は「文化財オンラインライブラリー」で、論文や報告書の本文テキストを登録・公開するWebサイトである。Webページ化によるアクセス性の向上、コンテンツの再利用、組版コストの削減などのメリットがあると述べる。
これらのシステムは、調査研究成果のオープンアクセスを促進し、FAIR原則に基づくデータ公開を実現することを目指している。
1. はじめに
戦後、文化財分野において着実な調査研究が進んだ結果、世界的にも豊かな調査研究成果を蓄積することができた。その成果の基本単位は文化財報告書(以下、報告書)である。しかしながら、多すぎて活用できないという情報爆発の弊害も生じており、適切に情報アクセスできるための対応策が求められている。「発掘調査報告書も、その活用度はけっして高くはない。いわば制御できないほどの情報を、日本考古学は抱えてしまった」という広瀬和雄の指摘(広瀬2015)に対する答えとして、文化財データリポジトリおよび文化財オンラインライブラリーを提示するものである。これらのシステム化は1982年の田中琢による「発掘調査のもたらす多量の情報に対処しうる情報処理システムの確立」(田中1982)にも応えるものである。
2. デジタル時代の報告書はいかにあるべきか
2024年3月27日時点で、全国遺跡報告総覧(以下、遺跡総覧)に登録されている文字数は31億字である。遺跡総覧においては、2割強ほどの報告書が電子公開されているので、電子化されていない報告書を含めて全体で100億字はくだらないだろう。もはや人間が可読できる量ではない。そのため、デジタル化による機械可読と検索性の向上は不可避である。デジタルの導入は、1990年代から始まり、データ再利用性向上を目指したFDやCDRの報告書への添付などがある(大工原1999)。2001 年の埋蔵文化財行政研究会シンポジウムでは、近い将来、研究報告書とデータファイルを組み合わせたデジタル報告書が理想と期待された(埋蔵文化財行政研究会 2002)。デジタル技術による調査の効率化、質の向上が指摘される一方、成果報告の形態がカギであるとされた。成果報告をデジタルとできれば、多くの情報を掲載でき、ページ概念もなくなる。ついては記録保存の概念規定の再構築にもつながるとされた。
海外では、FAIR原則(FAIR data principles)が浸透しつつある。Findable(見つけられる)、Accessible(アクセスできる)、Interoperable(相互運用できる)、Reusable(再利用できる)の意味であり、オープンデータ公開の原則である。研究データ利活用の国際動向であり、配慮していく必要がある。
以前より検討が続けられていた論文のオープンアクセスについて、2024年2月に具体策が公開された(https://www8.cao.go.jp/cstp/openscience/r6_0221/hosaku.pdf)。 例えば2025年度からの科学研究費助成事業では、学術論文及び根拠データの即時オープンアクセスの対象となる。
つまり、埋蔵文化財分野においては、1990年代~2000年代からのデジタルに関する議論があったが、それ以降は研究データ自体の電子公開の議論は低調であった。しかし、近年のFAIR原則による世界的潮流、学術論文及び根拠データの即時オープンアクセスという国の施策を踏まえれば、調査研究成果の電子公開は不可避であるといえる。であれば、文化財分野として意味のある電子公開を模索し、実践することが有意義であると考える。
3.文化財データリポジトリの概要
(1)システムの概要と背景
報告書には、多数の画像や図面が掲載されており、近年はボーンデジタルデータが多くなっている。しかし、アナログ媒体での流通が前提となるため、各画像や図面は、再利用性が低い状態である。PDF形式においても画像などのデジタルコンテンツと本文が癒着しているため、機械可読性が低く非構造化データであることが課題であった(図1)。そこで、デジタルデータはデジタルとして流通できるようデータリポジトリを構築した。
文化財データリポジトリ(2024年1月25日公開)
※データリポジトリ(Data Repository):研究データを保存・共有するための情報基盤
図1 現在の課題:文化財データの流れ (スムーズにデジタルデータが流通していない)
(2)データと機能
1.データ
下記のデータを登録可能である。調査時の成果を基本単位となるデータセットとして扱い、データセットの下位に画像などの個別データを登録する。各データは、ダウンロード可能で、利用ライセンスに基づき活用できる(図2~4)。
【主な登録可能なデータ】
・画像(jpg)
・図面類
PDF(ベクター情報が残った状態)
・3Dデータ(文化財データリポジトリへのデータ登録、Sketcfabの埋め込み表示)
・その他ファイル(CSV等)
2.検索機能
各データセットは、文化財所在地、文化財種別、主な時代、ファイルの種別、フリーワードで検索可能です。
図2 データセットの調査対象地情報
図3 Sketcfab登録の3Dデータは埋め込み表示可能
図4 報告書画像の表示例
(3)期待される効果
1.アクセス性の向上:検索機能とデータセットのID付与
データセットに調査地についての情報を付加した。文化財所在地や時代等によって検索でき、多数のデータから必要なデータを探すことができる。また、データセットごとにIDを付与した。IDを付与することで、今後のコンピュータ処理の際に、様々な展開や応用が可能となる。
2.再利用性の向上:ダウンロード機能・3次元データを3次元として扱う
従来、報告書の掲載図面については、利用者が必要に応じて再トレースをしていましたが、データをダウンロード可能にすることで、再トレース作業を軽減できる。3次元データについて、従来はすべて2次元図面化していましたが、場合によっては3次元のまま扱った方が理解に容易なケースもある。3次元データを3次元としてそのまま扱うことで、貴重な調査成果にて情報を欠落させることなく、新たな研究観点で再利用することが可能となる。
3.業務効率の向上:ライセンス明示によるオープンデータ化
報告書の元データを入手するには、画像利用許諾申請、情報公開請求等によって利用者が機関に照会する必要があった。発行機関においても照会対応等の事務手続きが発生し、相当な事務量となっている。利用者自らがデータを入手し、各データに明示されたライセンスに基づいた利用をすることによって双方の手間がなくなる。業務効率の向上によって文化財の活用を促進する。
(4)今後の展開
1.データ登録
現時点では管理者のみのデータ登録となっています。今後、全国遺跡報告総覧の発行機関ユーザーでも登録可能にする予定である。
2.データ連携
全国遺跡報告総覧内の書誌データとの紐づけをすることで、書誌と研究データを簡単に辿れるようにする。また、開発予定のオンラインジャーナルのデータプラットフォームとなる。さらに、他のプラットフォームとのデータ連携に取り組んでいく予定である。
4.文化財オンラインライブラリーの概要
(1)システムの概要と背景
報告書の電子公開では、近年PDFによる公開が増えている。しかし、PDF形式においては、画像などのデジタルコンテンツと本文が癒着しているため、機械可読性が低く非構造化データであることが課題であった。そこで、まずはデータと本文を分離するために文化財データリポジトリを2024年1月に公開した。そして本文を掲載するためのプラットフォームを今回公開した(図5・6)。
文化財オンラインライブラリー(2024年3月28日公開)
検索
一覧
図5 文化財オンラインライブラリー-記事画面
図6 文化財オンラインライブラリー-記事画面詳細
(2)本文データと機能
1.本文データの登録
本文テキストを登録可能である。論文および報告書の報告などの本文を登録できる。
1記事1URLで登録する。
【主な活用例】
・雑誌 論文
・報告書
2.検索機能
各記事は、タイトル、著者名、データ登録機関、文化財所在地、文化財種別、主な時代、遺跡種別、遺物種別、学問種別、テーマ、フリーワードで検索可能である。
3.PDF出力
オフライン環境で閲覧するためや必要に応じて印刷できるようPDF出力機能がある。PDF生成は夜間の日次処理にて自動生成され、登録の翌日に利用可能になる。
4.文化財データリポジトリとの連動
記事内で画像等のコンテンツを挿入する場合は、文化財データリポジトリに登録したコンテンツを利用する。
(3)期待される効果
1.アクセス性の向上:Webページ化と検索機能
記事がWebページ化することで、検索エンジンから劇的にアクセスされやすくなる。またブラウザにて多言語翻訳アプリも利用可能になることから、海外からもアクセスされやすくなることが見込まれる。
各記事には専門情報を付加している。文化財所在地や時代等によって検索でき、必要な記事を探すことができる。これらの属性情報は、今後のコンピュータ処理の際に、様々な展開や応用が可能となる。
2.再利用性および業務効率の向上
記事内のコンテンツは、文化財データリポジトリから挿入する。文化財データリポジトリに一度登録すると、何回も再利用できることから、よく使われる画像を何度も捜索し登録することはない。
3.コストの圧縮
近年、様々な事情で印刷を取りやめ電子公開になる刊行物が増えつつある。しかしPDFを主体とした公開であるため、組版は必要でした。Webページにて公開することで組版作業は不要になる。また登録作業がWeb画面で行われるため、これまでの組版等のDTP専門スキルは不要である。DTPスキルがない方でも登録が可能になる。
(4)今後の展開
1.データ登録
現時点では奈良文化財研究所のみ登録可能である。今後、全国遺跡報告総覧の発行機関ユーザーでも登録可能にする予定である。
2.引用関係の可視化
文化財論文については、文化財論文ナビにて個別論文にIDを付与している。文化財オンラインライブラリーの各記事に、個別論文IDを付与し整理することで、文化財論文同士の引用関係をネットワーク的に分析可能となる。調査研究支援のツールとなりえる。
参考文献
広瀬和雄 2015「解説」『考古学で現代を見る』
田中琢 1982「考古学、みかけだけのはなやかさ」『同朋』
大工原豊1999「発掘調査報告書の電子情報化について―フロッピーディスクからCD-ROM へ―」『考古学研究』183 号、考古学研究会
埋蔵文化財行政研究会2002『調査資料の取扱いと発掘調査報告のあり方-シンポジウム記録集-』研究発表論集第4集
引用-システム内 :
引用-システム外 :
使用データリポジトリ画像 :
NAID :
都道府県 :
時代 :
文化財種別 :
史跡・遺跡種別 :
遺物(材質分類) :
キーワード :
オープンアクセス
プラットフォーム
データリポジトリ
オンラインライブラリー
文化財
FAIR原則
オープンデータ
データ権利者 :
総覧登録日 :
2024-03-27
wikipedia 出典テンプレート :
{{Citation ... 開く