生成AI

最終更新日:2025/06/24
リコーは、経済産業省およびNEDOが推進するGENIACプロジェクトにおいて、日本企業向け図表を含むドキュメント読み取りに特化したマルチモーダルLLMの基本モデルを開発しました。7月29日開催のMIRU2025で論文発表し、ベンチマークと合わせて無償公開します。
このニュースのポイント
株式会社リコーは、経済産業省およびNEDOが推進するGENIACプロジェクトにおいて、日本企業の図表を含むドキュメントを読み取るマルチモーダル大規模言語モデル(LMM)の基本モデル開発を完了しました。
視覚情報とテキスト情報の両方を用いた日本語質問応答データセット「JDocQA」や独自のベンチマークツールによる評価で、他モデルに対して優れた性能を確認。7月29日から開催される「MIRU2025」にて論文を発表し、同モデルおよびベンチマークツールを無償公開する予定です。
企業内では請求書、技術資料、経営資料など多様な文書が活用されていますが、その多くには図や表が含まれており、従来の検索手法では必要な情報を効果的に取得できない課題がありました。
また、少子高齢化による労働力不足、技能継承、多言語対応といった経営課題に対しても、AIを活用した知識の効率的な活用が求められていますが、既存のLLMでは画像を含むビジネス文書の読解精度に限界があります。
リコーはこうしたニーズに対応すべく、GENIACプロジェクトにおいて日本企業の業務環境に適したLMMの開発に取り組んでいます。600万枚以上の視覚データを生成し、そのデータを用いてLMMの性能を向上させています。
また、FastLabelとの協力で実データの収集・アノテーションを行い、企業のセキュリティとプライバシーに配慮したコンパクトなモデルを構築。3層構造を採用し、高性能を維持しつつ省コスト・省リソースの運用を目指しています。
JDocQAに加えて、複雑な日本語文書に特化したマルチモーダル性の独自評価手法も構築されており、実運用を見据えた高い汎用性と信頼性を担保しています。
さらに、今回の取り組みにおいて、基本モデルをチューニングして個社の業務に合わせて精度を向上させる手法も確立しました。
リコーは、GENIACで得られた成果を広く社会に還元することで、ドキュメントの利活用を促進し、業務革新と効率的で付加価値の高い働き方を支援することで、日本企業の企業価値の向上に貢献することを目指して取り組みを進めます。
出典:株式会社リコー
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら