DXを推進するAIポータルメディア「AIsmiley」| AI製品・サービスの比較・検索サイト
03-6452-4750 10:00〜18:00 年末年始除く

日本初 明治期から昭和初期の手書き文字を解読する AI-OCRを凸版印刷が開発

最終更新日:2022/11/14

凸版印刷は、明治期から昭和初期の手書き文字に対応したAI-OCRを開発しました。

このAIニュースのポイント

  • 近代のくずし字を多く含む解読難易度の高い文書に対応したもの
  • 江戸時代のくずし字を対象としたAI-OCRをもとに、近代の多様な筆跡の手書き文字にまで対応の範囲を拡張させた
  • 様々なパターンの文字をAIに学習させ、難読文字の解読も可能

凸版印刷株式会社は、明治期から昭和初期の手書き文字に対応したAI-OCRを開発しました。

近代に作成されたくずし字を多く含む手書きの資料は、全国に大量に残存しています。その中には公文書、企業経営文書、業務日誌、書簡のような貴重な情報が記された資料が数多く含まれています。また、手書きの謄本類を取り扱う業務においては、近代の手書き資料の解読が日常的に行われていますが、これら資料の解読は、専門家にとっても難易度が高く手間のかかる作業であり、実用レベルのOCR技術もこれまで開発されていませんでした。

凸版印刷は、そのような課題を解決するため、神戸大学経済経営研究所附属企業資料総合センターおよび公益財団法人三井文庫との共同研究のもと、学術研究や業務の効率化をはかるため、近代のくずし字を解読するAI-OCR技術を独自に開発しました。

凸版印刷では2013年からさまざまな文献に対して、高い精度のテキストデータを提供する「高精度全文テキスト化サービス」を展開しています。このサービスで培ってきたテキストデータ化技術のシステム基盤を活用し、2015年以降、大学共同利用機関法人人間文化研究機構 国文学研究資料館との共同研究をはじめ、多数の研究機関とくずし字AI-OCR技術の開発・実証を進めてきました。現在では凸版印刷が提供するくずし字AI-OCRは、古典籍や古文書を扱う業界において代表的な商用サービスとして認知されています。

このAI-OCRは、現在凸版印刷が古文書解読とくずし字資料の利活用サービス「ふみのは」として提供している、江戸時代のくずし字を対象としたAI-OCRをもとに、近代の多様な筆跡の手書き文字にまで対応の範囲を拡張させたものです。

特徴として、難読文字の解読ができることが挙げられます。近代の手書き文字には、書き手によるくずし方のバラつきが大きい、筆記用具の多様化、カタカナ語が混在、旧字旧仮名遣い表記などの特性があり解読が非常に困難とされています。このAI-OCRでは様々なパターンの文字をAIに学習させることで、これらの難読文字の解読を実現しました。

今後は、神戸大学経済経営研究所附属企業資料総合センター等との実証実験を2022年11月より実施し、2023年4月より正式サービス開始を予定しています。

出典:TOPPAN

AIsmiley編集部

株式会社アイスマイリーが運営するAIポータルメディア「AIsmiley」は、AIの専門家によるコンテンツ配信とプロダクト紹介を行うWebメディアです。AI資格を保有した編集部がDX推進の事例や人工知能ソリューションの活用方法、ニュース、トレンド情報を発信しています。

・Facebookでも発信しています
@AIsmiley.inc
・Xもフォローください
@AIsmiley_inc
・Youtubeのチャンネル登録もお願いいたします@aiaismiley1345

メルマガに登録する

AIサービス
AI-OCR
DXトレンドマガジン メールマガジン登録

業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓・名

お名前を入力してください

メールアドレス

メールアドレスを入力してください

AI・人工知能記事カテゴリ一覧

今注目のカテゴリー

ChatGPT連携サービス

チャットボット

画像認識・画像解析

需要予測

ChatGPT連携サービス

チャットボット

画像認識・画像解析

需要予測

AI活用のご相談したい企業様はこちら

03-6452-4750

AI製品・ソリューションの掲載を
希望される企業様はこちら