生成AI

最終更新日:2025/06/18
Archaicは日本語業務文書に特化したRAGシステムAIを開発。公開ベンチマークの評価データセットで製造業カテゴリと全体平均でトップクラスの正答率を記録しました。
このニュースのポイント
株式会社Archaicは、日本語業務文書に特化したRAGシステムAIを開発しました。このAIは、図表や注釈を含む複雑な文書の構造を保持しながら自然な回答を生成する能力を持ち、公開ベンチマーク形式の評価データセットで、製造業カテゴリおよび全体平均でトップクラスの正答率を記録し、業務における高精度・高実用性が実証されました。
多くの業務文書には、文章だけでなく図や表、画像といった複合構造が含まれます。従来RAGでは構造理解が追いつかず、誤回答や情報の取りこぼしが課題でした。
ArchaicのRAGシステムAIは、複雑な文書(テキスト、図、表、画像を含む)における情報の断絶や構造理解の不足を克服し、高精度を実現。文書構造を理解し、情報の関連性を保持したまま生成AIに提供する仕組みを開発しました。
一般的なRAGは文章のみを対象とし、図や表が含まれると情報が欠けることがありますが、Archaic RAGはこれらを包括的に処理することで、回答の網羅性と正確性を大幅に向上しました。
文書解析エンジン(Parser)は、文書から文章や図、表、画像を自動で抽出し、構造と意味に応じた単位で分解することで、従来のRAGで処理できなかった非構造文書も生成AIが理解できる形に変換できます。
また、抽出した情報はTree-DATA構を用いて階層化され、本文と図、表と注釈といった関係性を維持したまま処理するため、正確で意味のある出力を実現しました。
性能評価とその方法に関しては、公開ベンチマーク形式の日本語RAG評価データセットを使用しました。このベンチマークは、金融、情報通信、製造、公共、流通、小売の5業種における、計300問からなる業務想定のQ&Aペアから構成され、生成結果の正答率によって性能を比較します。
また、検証に使用したLLMはClaude 3.5 Sonnetで統一し、RAG構築ロジックによる精度差を比較できます。
製造業カテゴリおよび全体平均において、比較対象としたRAG実装群の中で最も高い正答率を記録しました。
Archaicが開発したRAGシステムAIは、図表や注釈などを含む複雑な文書の構造を保持しながら、自然な回答を生成する「構造理解型RAG」として、業務活用における高精度・高実用性を実証しています。
出典:PR TIMES
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら