生成AI

最終更新日:2024/08/21
熊本大学とTOPPANは、くずし字AI-OCRを活用した古文書の大規模調査のための独自解読手法を開発しました。文献資料の大規模調査のための独自手法を確立するとともに、新しく発見された災害関連の記録を用い、現代の防災計画への活用を目指します。
このニュースのポイント
TOPPAN株式会社と国立大学法人 熊本大学は、歴史資料「細川家文書(ほそかわけもんじょ)」のうち、専門家でも解読が困難な難易度の高いくずし字で書かれた約5万枚の未解読の古文書(藩政記録)をAI-OCRを用いて短期間で解読し、約950万文字のテキストデータを生成することに成功しました。今回開発された手法により、文献資料の大規模調査が可能になり、新たに発見された災害関連の記録を現代の防災計画への活用が期待できます。
日本国内には数十億点以上の古文書が存在し、その中には防災や観光資源の創出に役立つ貴重な情報が含まれていますが、ほとんどが「くずし字」で書かれているため、現代人にとって判読が難しいという課題があります。
このような状況の中、熊本大学とTOPPANは、2021年より文献資料の新たな大規模調査手法の検討と、永青文庫所蔵資料に対するAI-OCRの精度向上に取り組んでいます。
今回熊本大学とTOPPANは、「細川家文書」の約5万枚・約950万文字を全文テキスト化し、大規模な古文書解読のためのシステム構築を行うとともに、地域における災害記録をはじめとした網羅的な調査を開始しました。
くずし字AI-OCRによる解読と検索システムが一体になることによって、これまでくずし字の解読が障壁となっていた古文書などの一次史料への網羅的調査が容易になります。検索により発見した資料を研究者が精査し、先行研究や定説との照合を行うことで、新たな発見や、歴史学をはじめとした様々な分野への一次史料の活用を促進します。
実際に今回解読した「細川家文書」の約5万枚の資料に対し、災害に関するキーワード「大雨、虫、飢、疫」などで調査したところ、洪水、作物虫害、飢饉、疫病の発生と、それへの対応が行政課題化した事実を示す記述などを、300件以上発見しました。
また、それらの中には、いままでよく知られていなかった17世紀後期の気象災害に起因する大規模な飢饉と疫病の蔓延を物語る熊本藩奉行所の執務記録の記述など、未知の重要な記述が含まれることが確認されており、熊本における地域防災などに今後活用するための研究に活用されます。
今後、熊本大学とTOPPANは、引き続き共同で「細川家文書」を解読し、当研究を通じて現代における防災計画や、歴史学の学習・研究の拡大に貢献していきます。また熊本大学は、江戸時代の長期にわたる社会変容の過程を通時的に把握し、九州に基点をすえた江戸時代社会史研究の深化に取り組んでいくとコメントしています。
出典:TOPPAN
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら