日本初 明治期から昭和初期の手書き文字を解読する AI-OCRを凸版印刷が開発
最終更新日:2022/11/14
凸版印刷は、明治期から昭和初期の手書き文字に対応したAI-OCRを開発しました。
このAIニュースのポイント
- 近代のくずし字を多く含む解読難易度の高い文書に対応したもの
- 江戸時代のくずし字を対象としたAI-OCRをもとに、近代の多様な筆跡の手書き文字にまで対応の範囲を拡張させた
- 様々なパターンの文字をAIに学習させ、難読文字の解読も可能
凸版印刷株式会社は、明治期から昭和初期の手書き文字に対応したAI-OCRを開発しました。
近代に作成されたくずし字を多く含む手書きの資料は、全国に大量に残存しています。その中には公文書、企業経営文書、業務日誌、書簡のような貴重な情報が記された資料が数多く含まれています。また、手書きの謄本類を取り扱う業務においては、近代の手書き資料の解読が日常的に行われていますが、これら資料の解読は、専門家にとっても難易度が高く手間のかかる作業であり、実用レベルのOCR技術もこれまで開発されていませんでした。
凸版印刷は、そのような課題を解決するため、神戸大学経済経営研究所附属企業資料総合センターおよび公益財団法人三井文庫との共同研究のもと、学術研究や業務の効率化をはかるため、近代のくずし字を解読するAI-OCR技術を独自に開発しました。
凸版印刷では2013年からさまざまな文献に対して、高い精度のテキストデータを提供する「高精度全文テキスト化サービス」を展開しています。このサービスで培ってきたテキストデータ化技術のシステム基盤を活用し、2015年以降、大学共同利用機関法人人間文化研究機構 国文学研究資料館との共同研究をはじめ、多数の研究機関とくずし字AI-OCR技術の開発・実証を進めてきました。現在では凸版印刷が提供するくずし字AI-OCRは、古典籍や古文書を扱う業界において代表的な商用サービスとして認知されています。
このAI-OCRは、現在凸版印刷が古文書解読とくずし字資料の利活用サービス「ふみのは」として提供している、江戸時代のくずし字を対象としたAI-OCRをもとに、近代の多様な筆跡の手書き文字にまで対応の範囲を拡張させたものです。
特徴として、難読文字の解読ができることが挙げられます。近代の手書き文字には、書き手によるくずし方のバラつきが大きい、筆記用具の多様化、カタカナ語が混在、旧字旧仮名遣い表記などの特性があり解読が非常に困難とされています。このAI-OCRでは様々なパターンの文字をAIに学習させることで、これらの難読文字の解読を実現しました。
今後は、神戸大学経済経営研究所附属企業資料総合センター等との実証実験を2022年11月より実施し、2023年4月より正式サービス開始を予定しています。
出典:TOPPAN
- AIサービス
- AI-OCR
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI・人工知能記事カテゴリ一覧
AI・人工知能サービス
- 生成AI
- 画像生成AI
- ChatGPT
- AI研究開発
- LLM
- DX推進
- おすすめAI企業
- チャットボット
- ボイスボット
- 音声認識・翻訳・通訳
- 画像認識・画像解析
- 顔認証
- AI-OCR
- 外観検査
- 異常検知・予知保全
- 自然言語処理-NLP-
- 検索システム
- 感情認識・感情解析
- AIモデル作成
- 需要予測・ダイナミックプライシング
- AI人材育成・教育
- アノテーション
- AI学習データ作成
- エッジAI
- IoT
- JDLA
- G検定
- E資格
- PoC検証
- RPAツール
- Salesforce Einstein
- Watson(ワトソン)
- Web接客ツール
- サプライチェーン
- メタバース
- AR・VR・デジタルツイン
- MI
- スマートファクトリー
- データ活用・分析
- 機械学習
- ディープラーニング
- 強化学習
- テレワーク・リモートワーク
- マーケテイングオートメーション・MAツール
- マッチング
- レコメンド
- ロボット
- 予測
- 広告・クリエイティブ
- 営業支援・インサイドセールス
- 省人化
- 議事録自動作成
- 配送ルート最適化
- 非接触AI
業態業種別AI導入活用事例
今注目のカテゴリー
AI製品・ソリューションの掲載を
希望される企業様はこちら