国立国会図書館が最新AI技術のOCR処理プログラムを活用

最終更新日:2024/03/06

国立国会図書館でOCRを活用

国立国会図書館から委託を受けた「OCR処理プログラムの研究開発」が完了したことを、モルフォAIソリューションズが発表しました。

このAIニュースのポイント

国立国会図書館が最新AI技術のOCR処理プログラムを活用
多様なレイアウト・文字種に対応しており、複雑な資料のテキスト化も可能
OCR処理プログラムの活用で、国会図書館の資料デジタル化が加速

株式会社モルフォAIソリューションズは、国立国会図書館からの「OCR処理プログラム研究開発」委託事業の完了を発表しました。

このOCR処理プログラムの開発により、国立国会図書館デジタルコレクション上で提供される資料画像において、本文テキストデータの作成を行えるようになりました。また、凸版印刷株式会社の協力により約1,300万文字のOCR学習用データセットを構築しています。

これにより、多様なレイアウト・文字種に対応できるようになり、既存のOCRサービスが対応できなかった明治期～昭和期までの複雑な資料のテキスト化が可能になりました。たとえば、戦前の旧かな文字を多用した文章でもスムーズなテキスト化ができます。

明治期～昭和期の書籍画像（2億枚）のテキスト化処理の研究開発

このほか、OCR処理プログラムの精度も向上しています。市販OCRでは、明治期～昭和初期の近代書籍・雑誌において、読み取り精度が約40％しかありませんでした。今回開発されたOCR処理プログラムでは、90％以上の読み取り精度を実現しています。

OCR処理プログラムの精度向上

学習用データを用意すれば追加学習も可能で、今後国立国会図書館がデジタル化する資料の全文テキストデータ作成に使用されます。プログラムのほかに、開発に用いた機械学習用データセット（著作権保護期間が満了したデジタル化資料から作成した分のみ）も近々に公開予定です。

このOCR処理プログラムの活用により、国立国会図書館に収蔵されている数々の貴重な資料がより幅広い分野で活用されることが期待されています。

出典：PR TIMES

AIsmiley編集部

株式会社アイスマイリーが運営するAIポータルメディア「AIsmiley」は、AIの専門家によるコンテンツ配信とプロダクト紹介を行うWebメディアです。AI資格を保有した編集部がDX推進の事例や人工知能ソリューションの活用方法、ニュース、トレンド情報を発信しています。

・Facebookでも発信しています @AIsmiley.inc
・Xもフォローください @AIsmiley_inc
・Youtubeのチャンネル登録もお願いいたします@aismiley
メルマガに登録する

AIサービス: 画像認識・画像解析; AI-OCR; 機械学習

導入活用事例: 行政・官公庁・地方自治体

DXトレンドマガジンメールマガジン登録

業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓・名

お名前を入力してください

お名前 - 名

名を入力してください

メールアドレス

メールアドレスを入力してください

AI・人工知能記事カテゴリ一覧

AI・人工知能サービス

特集

今注目のカテゴリー

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

AI活用のご相談したい企業様はこちら

03-6452-4750

AI活用を無料で相談する

AI製品・ソリューションの掲載を
希望される企業様はこちら

詳細はこちら

国立国会図書館が最新AI技術のOCR処理プログラムを活用

AI・人工知能記事カテゴリ一覧

AI・人工知能サービス

業態業種別AI導入活用事例

特集

今注目のカテゴリー

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

ニュースPVランキング

Google、GeminiでWorkspaceのコンテンツ作成を…

Google、GoogleマップにGeminiを搭載し大型アップ…

RX Japan、東京ビッグサイトで1,100社が出展する日本最…

エヴィクサーとシヤチハタ、生成AIによるディープフェイクの悪用防…

国立国会図書館が最新AI技術のOCR処理プログラムを活用

AI・人工知能記事カテゴリ一覧

AI・人工知能サービス

業態業種別AI導入活用事例

特集

今注目のカテゴリー

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

ニュースPVランキング

Google、GeminiでWorkspaceのコンテンツ作成を…

Google、GoogleマップにGeminiを搭載し大型アップ…

RX Japan、東京ビッグサイトで1,100社が出展する日本最…

エヴィクサーとシヤチハタ、生成AIによるディープフェイクの悪用防…

関連記事

シャープ、「介護向けAIトレーナー」を開発。AIとテレビを活用し介護施設で高齢者の機能訓練業務を支援

アイスマイリー、4/22（水）から3日間「第26回 マーケティングWeek -春 2026-」にブース出展

Google、GoogleマップにGeminiを搭載し大型アップグレード。会話型検索と3Dルート案内を提供

アイスマイリー、3/24（火）から2日間「AI/DX 営業・マーケティング展 2026 Spring」にブース出展

アイスマイリー、4/15（水）から3日間、東京ビッグサイトにて開催のNexTech Week 2026【春】内、「AI・人工知能EXPO」にブース出展

Google Imagenとは？使い方や無料版、商用利用の注意点を解説

アイスマイリー、4/22（水）から3日間「第26回マーケティングWeek -春 2026-」にブース出展