DXを推進するAIポータルメディア「AIsmiley」| AI製品・サービスの比較・検索サイト
03-6452-4750 10:00〜18:00 年末年始除く

リコー、GENIACでマルチモーダルLLMの基本モデルを開発。7月に無償公開

最終更新日:2025/06/24

リコー LMM基本モデル公開へ

リコーは、経済産業省およびNEDOが推進するGENIACプロジェクトにおいて、日本企業向け図表を含むドキュメント読み取りに特化したマルチモーダルLLMの基本モデルを開発しました。7月29日開催のMIRU2025で論文発表し、ベンチマークと合わせて無償公開します。

このニュースのポイント

  • 日本企業の図表を含むドキュメント読み取りに対応したLMM基本モデルを開発。7月29日より無償提供
  • 独自の技術によりアーキテクチャも改良され、オンプレミス環境において、顧客情報を用いた追加学習が可能なコンパクトなモデルサイズを実現
  • 600万枚以上の視覚データとFastLabelとの連携による実データ収集でモデル性能を強化

株式会社リコーは、経済産業省およびNEDOが推進するGENIACプロジェクトにおいて、日本企業の図表を含むドキュメントを読み取るマルチモーダル大規模言語モデル(LMM)の基本モデル開発を完了しました。

視覚情報とテキスト情報の両方を用いた日本語質問応答データセット「JDocQA」や独自のベンチマークツールによる評価で、他モデルに対して優れた性能を確認。7月29日から開催される「MIRU2025」にて論文を発表し、同モデルおよびベンチマークツールを無償公開する予定です。

 

企業内では請求書、技術資料、経営資料など多様な文書が活用されていますが、その多くには図や表が含まれており、従来の検索手法では必要な情報を効果的に取得できない課題がありました。

また、少子高齢化による労働力不足、技能継承、多言語対応といった経営課題に対しても、AIを活用した知識の効率的な活用が求められていますが、既存のLLMでは画像を含むビジネス文書の読解精度に限界があります。

リコーはこうしたニーズに対応すべく、GENIACプロジェクトにおいて日本企業の業務環境に適したLMMの開発に取り組んでいます。600万枚以上の視覚データを生成し、そのデータを用いてLMMの性能を向上させています。

また、FastLabelとの協力で実データの収集・アノテーションを行い、企業のセキュリティとプライバシーに配慮したコンパクトなモデルを構築。3層構造を採用し、高性能を維持しつつ省コスト・省リソースの運用を目指しています。

JDocQAに加えて、複雑な日本語文書に特化したマルチモーダル性の独自評価手法も構築されており、実運用を見据えた高い汎用性と信頼性を担保しています。

さらに、今回の取り組みにおいて、基本モデルをチューニングして個社の業務に合わせて精度を向上させる手法も確立しました。

リコーは、GENIACで得られた成果を広く社会に還元することで、ドキュメントの利活用を促進し、業務革新と効率的で付加価値の高い働き方を支援することで、日本企業の企業価値の向上に貢献することを目指して取り組みを進めます。

出典:株式会社リコー

AIsmiley編集部

株式会社アイスマイリーが運営するAIポータルメディア「AIsmiley」は、AIの専門家によるコンテンツ配信とプロダクト紹介を行うWebメディアです。AI資格を保有した編集部がDX推進の事例や人工知能ソリューションの活用方法、ニュース、トレンド情報を発信しています。

・Facebookでも発信しています @AIsmiley.inc
・Xもフォローください @AIsmiley_inc
・Youtubeのチャンネル登録もお願いいたします@aiaismiley1345
メルマガに登録する

AIサービス
生成AI
AI研究開発
LLM
DXトレンドマガジン メールマガジン登録

業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓・名

お名前を入力してください

メールアドレス

メールアドレスを入力してください

AI・人工知能記事カテゴリ一覧

今注目のカテゴリー

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

AI活用のご相談したい企業様はこちら

03-6452-4750

AI製品・ソリューションの掲載を
希望される企業様はこちら