Archaic、日本語特化型RAGシステムAIを開発。製造業分野でトップクラスの正答率

最終更新日:2025/06/18

Archaic 日本語特化RAG開発

Archaicは日本語業務文書に特化したRAGシステムAIを開発。公開ベンチマークの評価データセットで製造業カテゴリと全体平均でトップクラスの正答率を記録しました。

このニュースのポイント

日本語業務文書に特化したRAGシステムAIは、性能評価において、製造業カテゴリおよび全体平均スコアでトップクラスを記録
従来のRAGでは処理できなかった文章・図・表・画像を自動抽出し、構造と意味に応じた単位で処理
誤った回答や情報の取りこぼしを防ぎ、文章と図、表と注釈などの関係性を維持したまま活用

株式会社Archaicは、日本語業務文書に特化したRAGシステムAIを開発しました。このAIは、図表や注釈を含む複雑な文書の構造を保持しながら自然な回答を生成する能力を持ち、公開ベンチマーク形式の評価データセットで、製造業カテゴリおよび全体平均でトップクラスの正答率を記録し、業務における高精度・高実用性が実証されました。

多くの業務文書には、文章だけでなく図や表、画像といった複合構造が含まれます。従来RAGでは構造理解が追いつかず、誤回答や情報の取りこぼしが課題でした。

ArchaicのRAGシステムAIは、複雑な文書（テキスト、図、表、画像を含む）における情報の断絶や構造理解の不足を克服し、高精度を実現。文書構造を理解し、情報の関連性を保持したまま生成AIに提供する仕組みを開発しました。

一般的なRAGは文章のみを対象とし、図や表が含まれると情報が欠けることがありますが、Archaic RAGはこれらを包括的に処理することで、回答の網羅性と正確性を大幅に向上しました。

文書解析エンジン（Parser）は、文書から文章や図、表、画像を自動で抽出し、構造と意味に応じた単位で分解することで、従来のRAGで処理できなかった非構造文書も生成AIが理解できる形に変換できます。

また、抽出した情報はTree-DATA構を用いて階層化され、本文と図、表と注釈といった関係性を維持したまま処理するため、正確で意味のある出力を実現しました。

性能評価とその方法に関しては、公開ベンチマーク形式の日本語RAG評価データセットを使用しました。このベンチマークは、金融、情報通信、製造、公共、流通、小売の5業種における、計300問からなる業務想定のQ＆Aペアから構成され、生成結果の正答率によって性能を比較します。

また、検証に使用したLLMはClaude 3.5 Sonnetで統一し、RAG構築ロジックによる精度差を比較できます。

製造業カテゴリおよび全体平均において、比較対象としたRAG実装群の中で最も高い正答率を記録しました。

Archaicが開発したRAGシステムAIは、図表や注釈などを含む複雑な文書の構造を保持しながら、自然な回答を生成する「構造理解型RAG」として、業務活用における高精度・高実用性を実証しています。

出典：PR TIMES

AIsmiley編集部

株式会社アイスマイリーが運営するAIポータルメディア「AIsmiley」は、AIの専門家によるコンテンツ配信とプロダクト紹介を行うWebメディアです。AI資格を保有した編集部がDX推進の事例や人工知能ソリューションの活用方法、ニュース、トレンド情報を発信しています。

・Facebookでも発信しています @AIsmiley.inc
・Xもフォローください @AIsmiley_inc
・Youtubeのチャンネル登録もお願いいたします@aismiley
メルマガに登録する

AIサービス: 生成AI; LLM; RAG

DXトレンドマガジンメールマガジン登録

業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓・名

お名前を入力してください

お名前 - 名

名を入力してください

メールアドレス

メールアドレスを入力してください

シェアする

AI・人工知能記事カテゴリ一覧

AI・人工知能サービス

特集

今注目のカテゴリー

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

DXトピックス

AIsmileyからご案内

FOLLOW US

SNSをフォローして、最新情報をチェックできます！

DXトレンドマガジンメールマガジン登録

メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓・名

お名前を入力してください

お名前 - 名

お名前 - 名を入力してください

メールアドレス

メールアドレスを入力してください

ニュースPVランキング

週間PVランキング

OpenAI、エージェント活用型コーディングモデル「GPT-5.…

楽天、国内最大規模の高性能AIモデル「Rakuten AI 3.…

フルスイング by DeNA、現場のAI活用事例100本をまとめ…

Google、「Gemini 3 Flash」を公開。低遅延、高…

AI活用のご相談したい企業様はこちら

03-6452-4750

AI活用を無料で相談する

AI製品・ソリューションの掲載を
希望される企業様はこちら

詳細はこちら