世界中の多くの地域と同様に、日本にも疫病に苦しめられ、疫病と共存してきた歴史があります。出版文化が栄えた江戸時代には、疫病の予防法や病中の心得などを記した多数の出版物が刊行されました。たとえば文久2年(1862年)には、麻疹の大流行を受けて「はしか絵」と呼ばれる錦絵が大量に出版され、現代に伝わっています。Transcription Project: Tackling Pandemics in Early Modern Japan(以下、Tackling Pandemicsプロジェクト)は、こうした江戸時代の疫病資料をオンラインで翻刻することを目的としたプロジェクトです。「翻刻」とは歴史学の用語で、文献資料に書かれた文字を活字に起こし、あらためて紙媒体で出版したり、オンラインで公開したりする作業のことを言います。
Tackling Pandemicsプロジェクトの主催者は、ケンブリッジ大学エマニュエルカレッジで近世日本文学を教えるラウラ・モレッティ(Laura Moretti)先生です。もともとモレッティ先生は近世の和本資料を対象にした「総合的和本リテラシー」サマースクール(https://wakancambridge.com/)を毎年ケンブリッジ大学で実施し、参加者に江戸時代の資料の読解方法を教授していたのですが、COVID-19の影響で2020年は開催を断念せざるを得ませんでした。Tackling Pandemicsプロジェクトは、このサマースクールの代替として企画された、完全にオンラインのプロジェクトです。
現在このプロジェクトには、イギリス、アメリカ、ロシア、中国、日本など世界中の様々な教育機関に所属する大学院生や研究者、学芸員など33名が参加しています。それぞれ専門分野は異なりますが、江戸時代の日本文化に関心を抱いているという点では共通しています。プロジェクトのWebサイトでは、国文学研究資料館や東京大学図書館がデジタル公開している天然痘やコレラ、麻疹などに関連する資料を公開しています(Figure 1)。これに加えて、ヴィクトリア&アルバート博物館、モレッティ先生が所蔵する鈴蘭文庫、またエビ文庫というコレクションからも資料を収録しています。これらの資料の翻刻を参加者の手で完成させ、その過程で江戸時代の文献を読解する能力を培うことが本プロジェクトの目的です。
私自身は、デジタル人文学(Digital Humanities)の研究者兼開発者として、このプロジェクトを技術面からサポートする役割を果たしています。プロジェクトのより詳しい目的や意義については、後日モレッティ先生がTeaching Momentのコーナーに記事を寄稿する予定ですので、この記事では、参加者がオンラインで翻刻文を入力や共有に使用している「みんなで翻刻」(https://honkoku.org/)というシステムを紹介します。
もともと「みんなで翻刻」のシステムは、近世以前の地震資料を対象とした市民参加型の翻刻プラットフォームとして2017年に公開されました。システムの開発・運営を担っているのは、私が大学院生時代から所属している京都大学古地震研究会という、自然科学と人文学研究者の学際グループです。古地震研究会は地震研究および防災研究への応用を目的として、地震資料の翻刻に10年近く取り組んできました。地震の発生にはある程度の周期性があり、その発生メカニズムを理解し、将来の地震災害に備えるためには、過去に発生した地震の研究が必要不可欠です。しかしながら、計器を用いた近代的な地震観測の記録は19世紀末以降のものしか存在しません。このため、江戸時代以前に発生した地震についての情報を得るためには、古文書などの文献資料を収集・翻刻し、その記述から地震の規模や被害状況を推定する必要があるのです。
古地震研究会は2011年の東日本大震災を契機にその活動を開始し、2017年までにおよそ13万文字の地震資料を翻刻しました。しかしながら、日本国内には膨大な点数の文献資料が保存されており、古地震研究会のような少数の研究者グループが翻刻できる分量には限りがあります。そこで、インターネット経由で多数の市民の参画を募り、一挙に大量の地震資料の翻刻を進めようという計画が立てられました。このために開発されたシステムが「みんなで翻刻」です。こうした手法はデジタル人文学の分野でクラウドソーシング翻刻(crowdsourced transcription)と呼ばれており、University College Londonが主催するTranscribe Benthamや、US National ArchivesのCitizen Archivistなど、多数の同種のプロジェクトが実施されています。
ただし、近世以前の日本語資料を対象にクラウドソーシング翻刻を実施した事例は「みんなで翻刻」以前にはありません。というのも、江戸時代以前に日本で出版・筆記された文献の大多数はいわゆる「くずし字」で記述されているためです。明治時代以降の近代化を通じて、くずし字は日本の公教育と出版の世界から姿を消していきました。その結果、現代の日本人でくずし字の解読能力を有する人々は、人口の0.01%にも満たないという状況にあります。
この課題に対して「みんなで翻刻」は、クラウドソーシング翻刻のシステムを一種の学習サービスとして設計するアプローチを取りました。たとえば、参加者が資料を翻刻した内容は全参加者共通の「タイムライン」(Figure 2)で共有され、他の参加者からの添削を受けることができます。また、くずし字学習を支援するモバイルアプリとも連携しています。これに加えて2019年7月に公開したバージョンでは、AIによるくずし字認識のサポートの提供も始めています。このAIプログラムは人文学オープンデータ共同利用センター(CODH)と凸版印刷株式会社からそれぞれ提供頂いたもので、資料画像中のくずし字を指定すると、スコア付きで読み方を提供してくれます(Figure 3)。くずし字の翻刻は非常に難度の高い作業ですが、AIのサポートを受けることで初学者でも心理的障壁を感じることなく取り組むことができます。
Reading early modern Japanese texts with AI: interview with Hashimoto Yuta (Youtube, July 2, 2020)
幸いなことに「学習」に力点を置いた「みんなで翻刻」のアプローチは非常に上手く機能しました。2020年6月までに6,000人以上の人々が「みんなで翻刻」上で翻刻作業に参加し、1,200点以上の資料の翻刻が完了しました。参加者により翻刻された文字の合計は900万字に及びます。
モレッティ先生のプロジェクトに「みんなで翻刻」のシステムを採用することになったのは、昨年開催された「くずし字とAI」をテーマにしたシンポジウムでの私の講演を、モレッティ先生が偶然オンラインで視聴したことがきっかけです。Tackling Pandemicsプロジェクトでは、参加者のみがアクセス可能なサーバーに「みんなで翻刻」のシステムを展開し、クローズドな形で運用しています。資料の翻刻が完了し、プロジェクトが終了した暁には、一般の人々がアクセス可能な「みんなで翻刻」本体のWebサイトで翻刻の成果を公開することになっています。
本記事の執筆時点では、Tackling Pandemicsプロジェクトが開始してから一ヶ月も経過していません。主催者のモレッティ先生も、技術担当の私も、まだまだ手探りで取り組みを進めている状態です。しかしながら参加者の活動は活発で、英語と日本語で議論を交わしながら疫病資料の翻刻に取り組んでいます。大学院時代に初めてくずし字に触れ、まだまだ手書きの資料の解読が苦手な私にとっては、日本語を母語としないヨーロッパやアメリカの参加者が正確にくずし字を翻刻する光景は驚異に他なりません。今後、プロジェクトがどのように推移していくか非常に楽しみにしています。
Suggested Readings (optional)
Transcription Project: Tackling Pandemics in Early Modern Japan, https://wakancambridge.com/project-2020/.
Hedges, Mark, and Stuart Dunn. Academic Crowdsourcing in the Humanities: Crowds, Communities and Co-production. Chandos Publishing, 2017.
Yuta Hashimoto is a researcher of Digital Humanities and an Assistant Professor at National Museum of Japanese History, Japan. His study focuses on the applications of information technologies such as crowdsourcing and image analysis to historical research. He is also an iOS/Android developer and has published several apps for digital humanities research.
Related:
1096 Eichō Earthquake and Tsunami :: Kristina Buhrman (United States)
Rethinking Normalcy :: Zheng Guan (United States)
Teaching the COVID-19 Pandemic on the Colorado Plateau :: Daniel Burton-Rose (United States)
* * *
The Teach311 + COVID-19 Collective began in 2011 as a joint project of the Forum for the History of Science in Asia and the Society for the History of Technology Asia Network and is currently expanded in collaboration with the Max Planck Institute for the History of Science (Artifacts, Action, Knowledge) and Nanyang Technological University-Singapore.