生成AI

最終更新日:2025/07/01
スニフアウトは、あらゆる形式のファイルを RAG が扱いやすい形式へ変換する新システム「RAG Ready Converter(β)」を公開しました。
このニュースのポイント
株式会社スニフアウトは、あらゆる形式のファイルを RAG が扱いやすい形式へ変換する新システム「RAG Ready Converter(β)」を公開しました。
生成AI導入の入り口として、文書検索システムの構築などを目的としたRAG(Retrieval-Augmented Generation) の導入に取り組んでいる企業は非常に多いですが、最初から高い精度を実現できている企業は非常に少ないです。その原因としてRAG readyではないデータを使用してることに起因しています。
RAGはテキストデータを取り扱うことを前提としているため、画像や図式・フローチャートなどが混在すると非テキスト情報が欠落し、検索・生成精度が大幅に低下します。
RAG Readyデータとは、画像・表・フローチャートなど本来テキストではない論理構造などの情報がテキストのモーダルで表現されており、情報欠如が起こらないように設計されたテキストデータのことです。
「RAG Ready Converter」は、画像やExcel、PowerPointなどの多様なビジネスファイルを独自の特許技術を使用して、RAGで読み込こむことができるテキストデータに変換するシステムです。
データ変換事例として画像データでは、説明されている内容を情報欠如がないようにマークダウンやプログラムなどを使用し、正しく論理構造を保持したテキストに変換します。
Excelファイルでは罫線などによって表現される情報や、情報の構造などを情報欠如がない形のテキストに変換することが可能です。
パワーポイント資料では、全体の構造などを通してユーザーに伝えている情報も情報欠如がないようにテキストに変換することが可能です。
また「RAG Ready Converter」の特長としてRAGの精度向上が挙げられます。クローズドベータで精度を試した結果、RAG精度は使用前56%から92%に、取扱可能ファイル率も使用前22%から91%と上昇しました。
また、本サービスはAPIとしての提供を基本としていますが、GUIで操作可能なプレイグラウンドも用意しており、RAG関連サービスを提供しているベンダーや、生成AIに取り組むエンジニアからビジネスサイドの方まで幅広く使用できます。
出典:PR TIMES
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら