生成AI

最終更新日:2022/11/14
凸版印刷は、明治期から昭和初期の手書き文字に対応したAI-OCRを開発しました。
このAIニュースのポイント
凸版印刷株式会社は、明治期から昭和初期の手書き文字に対応したAI-OCRを開発しました。
近代に作成されたくずし字を多く含む手書きの資料は、全国に大量に残存しています。その中には公文書、企業経営文書、業務日誌、書簡のような貴重な情報が記された資料が数多く含まれています。また、手書きの謄本類を取り扱う業務においては、近代の手書き資料の解読が日常的に行われていますが、これら資料の解読は、専門家にとっても難易度が高く手間のかかる作業であり、実用レベルのOCR技術もこれまで開発されていませんでした。
凸版印刷は、そのような課題を解決するため、神戸大学経済経営研究所附属企業資料総合センターおよび公益財団法人三井文庫との共同研究のもと、学術研究や業務の効率化をはかるため、近代のくずし字を解読するAI-OCR技術を独自に開発しました。
凸版印刷では2013年からさまざまな文献に対して、高い精度のテキストデータを提供する「高精度全文テキスト化サービス」を展開しています。このサービスで培ってきたテキストデータ化技術のシステム基盤を活用し、2015年以降、大学共同利用機関法人人間文化研究機構 国文学研究資料館との共同研究をはじめ、多数の研究機関とくずし字AI-OCR技術の開発・実証を進めてきました。現在では凸版印刷が提供するくずし字AI-OCRは、古典籍や古文書を扱う業界において代表的な商用サービスとして認知されています。
このAI-OCRは、現在凸版印刷が古文書解読とくずし字資料の利活用サービス「ふみのは」として提供している、江戸時代のくずし字を対象としたAI-OCRをもとに、近代の多様な筆跡の手書き文字にまで対応の範囲を拡張させたものです。
特徴として、難読文字の解読ができることが挙げられます。近代の手書き文字には、書き手によるくずし方のバラつきが大きい、筆記用具の多様化、カタカナ語が混在、旧字旧仮名遣い表記などの特性があり解読が非常に困難とされています。このAI-OCRでは様々なパターンの文字をAIに学習させることで、これらの難読文字の解読を実現しました。
今後は、神戸大学経済経営研究所附属企業資料総合センター等との実証実験を2022年11月より実施し、2023年4月より正式サービス開始を予定しています。
出典:TOPPAN
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら