NHK 解説委員室

これまでの解説記事

みんなで判読!古文書の災害記録をいかせ

松本 浩司  解説委員

m230721_002.jpg

古文書には多くの地震や水害などが記録されていて将来の災害を予測する重要な手がかりになります。専門家にしか読めないためその一部しか活用されていなかったのですが、AIやインターネットを使って多くのボランティアが協力して読み解く取り組みが広がり、注目されています。

【古文書の災害記録】

Q)そもそも古文書はどのくらいあるものなのですか?

A)

m230721_005.jpg

江戸時代以前の古文書には歴史書から行政文書、日記や書状などさまざまな種類があり、少なく見積もって20億点以上あると考えられています。

災害の記録や記述があるものも多く、例えば日本書紀には684年に起きた南海トラフ地震と見られる記述があり、発生間隔を推定する重要な根拠のひとつになっています。

m230721_008.jpg

このように古文書によって過去の災害を知り、将来の災害を予測することができますが、経験を積んだ専門家にしか読むことができないため、解読できる史料の数には限界がありました。

しかしAIやインターネットを活用した新たな取り組みで研究の環境が大きく変わろうとしています。

【「みんなで翻刻」プロジェクト】

Q)どんな取り組みなのですか?

A)

m230721_009.jpg

一部の専門家だけで行っていた作業を大勢で進める「みんなで翻刻」というプロジェクトです。大学や国立歴史民俗博物館の研究者が6年前から運営しているインターネットのサイトで、誰でも参加できます。

m230721_012.jpg

古文書の多くは「くずし字」と呼ばれる手書きの文字で書かれています。
「翻刻」というのはこれを判読して今の活字に変えていく作業のことを言います。

知識と経験が必要ですが、このサイトではAI=人工知能の力を借りることで初心者を含め多くの人が作業に参加することができます。

m230721_V1_1.jpg

作業の進め方です。右側の古文書を読んで活字に変えていきます。

m230721_V1_2.jpg

途中で読めない文字が出たら、その文字を囲んでAIに認識させます。

m230721_V1_4.jpg

AIは5つの候補の文字を提案し、それぞれが正解である確率も示してくれます。

m230721_V1_5.jpg

これを参考に、ここでは「夜」と判断して入力します。

それでも判断がつかなかったり、自信がなかったりしたときはインターネットを通じ、経験を積んだほかの参加者たちからアドバイスを受けたり、議論をしたりすることもできる仕組みです。

Q)これなら参加しやすそうですね。

A)

m230721_016.jpg

ひとりひとりが好きな時間に少しずつ判読をして、参加者たちがリレー形式でひとつの古文書を仕上げていきます。
これまでに延べ8000人が参加して、2000点の古文書や史料、文字数にして3200万文字を翻刻しています。

Q)どんな人が参加しているのでしょうか?

A)
歴史や文学の愛好家だけでなく趣味や教養としてさまざまな年代の人が取り組んでいます。その一人にお話を聞きました。

m230721_V2_1.jpg

森脇美沙さんは6年ほど前から「みんなで翻刻」に参加しています。
子供のころから文学や古典に興味があり、大学院生のときに知って夢中になりました。
いまは毎日、仕事の昼休みの30分間のほか、休日には半日くらい費やすこともあるそうです。

翻刻の魅力を森脇さんは「推理パズル」に例えます。
森脇さんは「文字は人によって癖があるので、文脈とか意味を考えながらみんなで協力して『推理パズル』を解いていく感じです。自分がひらめいて提案した文字に対して、みんなが納得して『十中八九そうだね』と認められたときはうれしいですね」と話していました。

Q)推理パズルにたとえると面白さがわかるような気がしますね。

A)
そうですね。また定期的に集まって翻刻に取り組んでいるグループもあります。

m230721_018.jpg

福井県文書館は所蔵する古文書などのデジタル化を進めていて一般の参加者を募って年に2回「みんなで翻刻」の講座を開催しています。

そのうち10人ほどが毎月、勉強会を開きグループで翻刻に取り組んでいます。
日頃抱いている疑問を出し合ったり、助言をしあったりして翻刻の技術を高めています。

【翻刻をいかした「災害の記憶デジタルミュージアム」】

Q)みんなで翻刻の信頼性や活用方法はどうなのでしょうか?

A)
検証をすると、正確性は98.5パーセントで、プロの翻刻には及びませんが、高い信頼性が確認されているということです。

活用については、多くの資料を誰でも読めるようになり、研究や調査が格段に進めやすくなります。またデジタルデータなので検索がしやすくなり、活用方法も大きく広がります。
ふたつの取り組みをご紹介します。

m230721_V3_1.jpg

▼先月から公開されているインターネット上のデジタルミュージアムです。
大手保険会社の初代社長が収集した膨大な古文書の中から水害と地震の記録を中心に26点がインターネットのバーチャル空間で展示されています。古文書を解説するにあたって「みんなで翻刻」で活字化された文が使われています。

m230721_V3_3.jpg

▼1847年に今の長野県で発生した大地震「善光寺地震」の絵地図です。

地震の揺れや火災による被害だけでなく、揺れによる土砂崩れによってせき止められていたダムが決壊して発生した大洪水による被害が絵と文章で克明に記録されています。

m230721_V3_4.jpg

m230721_V3_6.jpg

▼1854年の安政南海地震で大阪の町を襲った大津波の記録です。
大津波が川を遡り、安全だと思って船に避難していた大勢の人たちが巻き込まれた惨状が記されています。

m230721_V3_8.jpg

翻刻によって活字化された文章を合成音声で聞くこともできます。

【翻刻で確認された情報のデジタルマップ化】
Q)もうひとつの取り組みは?

A)

m230721_V4_1.jpg

みんなで翻刻では1855年の安政江戸地震について記した古文書100点を翻刻しました。
これによって、これまでの研究では知られていなかった現象も含め、多くの災害の状況が確認できました。

m230721_V4_3.jpg

m230721_V4_5.jpg

その状況を、現在のデジタル地図上に落とし込んでいく作業が進められています。
火災発生が記述されている場所や建物被害が記述されている場所などが丸で示され、そこをクリックすると翻刻された文章が表示されます。
どこで何が起きたのかを地図で確認し、被害の広がりを直感的に理解できるようにする狙いです。
研究グループではボランティアに協力してもらってデジタルマップ化を進めたいと考えています。

m230721_019.jpg

「みんなで翻刻」の主宰者のひとりで東京大学地震研究所の加納靖之准教授は「人が一生の間に経験する災害は多くはなく、そのことが防災対策や避難など災害への備えを妨げたり、遅らせたりする面があると思います。身近にある多くの古文書の翻刻によって地域にどんな災害があったかを知り、将来の災害への備えにつなげてもらいたいと考えています」と話しています。

Q)みんなで楽しみながら翻刻をして、それが防災に役立つというのはすばらしいですね。

A)
福井の例を見ましたが、専門家だけではカバーしきれない地域の古文書の解明が進めば、知られていなかった地域の災害リスクがわかる可能性があります。身近な防災を考えるために地域での取り組みを広げることも大切になってくると思います。


この委員の記事一覧はこちら

松本 浩司  解説委員

こちらもオススメ!