RAGデータ作成ツール ソフトバンク株式会社
~生成AI×自社データ連携時のRAG回答精度向上を支援~ソフトバンク株式会社が提供する「RAGデータ作成ツール」は 生成AIの回答精度の改善において作業負荷が高い「データ作成」や「回答精度評価」を ワンストップで効率化し、回答精度の向上を支援します。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| 案件詳細を伺ってお見積りいたします。 | なし | なし | なし |
AIエージェント
生成AI
ChatGPT連携サービス
AI受託開発
対話型AI -Conversational AI-
ボイスボット
バーチャルヒューマン
教師データ作成
AI研究開発
通訳・翻訳
声紋認証
機密情報共有・管理
契約書管理システム
ワークステーション
FAQシステム
AIカメラ
生体認証
インボイス制度対応システム
データセットの収集・購入
コールセンター
人事・総務向け
インバウンド対策
コンバージョンアップ
KYT・危険予知で労働災害防止
無料AI活用
顧客リスト自動生成
ロボットで自動化
LINE連携
セキュリティー強化
テレワーク導入
AI学習データ作成
配送ルート最適化
非接触AI
受付をAIで自動化、効率化
AIリテラシーの向上サービス
日本語の手書き文字対応AI-OCR
Windows作業の自動化RPAツール
リスク分析AIで与信管理
紙帳票仕分けAI-OCRサービス
サプライチェーン
AIコンサルティング
一括資料請求なら、導入の比較検討が
スムーズに行えます!
利用料金・初期費用・無料プラン・トライアルの有無などを、一覧で比較・確認できるページです。サービスを比較・検討後、希望条件に合うものが見つかりましたら、下記のボタンよりご請求いただけます。
~生成AI×自社データ連携時のRAG回答精度向上を支援~ソフトバンク株式会社が提供する「RAGデータ作成ツール」は 生成AIの回答精度の改善において作業負荷が高い「データ作成」や「回答精度評価」を ワンストップで効率化し、回答精度の向上を支援します。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| 案件詳細を伺ってお見積りいたします。 | なし | なし | なし |
株式会社CREAには、大手自動車メーカーの生産技術部門出身のメンバーが在籍しており、製造現場に精通した実践的なご提案が可能です。が開発する「業界専門書類の自動作成AI」は、製造業など各業界特有の複雑な書類やフォーマットを、簡単な指示だけでスピーディーに作成。ソフトウェアだけでなく、AIを用いたハード部品や装置の設計も承ります。さらに、書類作成にとどまらず、現場課題に最適化したAIエージェントや業務支援システムの開発・提案も可能。 導入から運用まで、ワンストップでご支援いたします。製造業はもちろん、他業界のお客様からのご相談も歓迎しております。まずはお気軽にご相談ください。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| 60万円~ | なし | なし | なし |
最先端のAIで大幅の人件費削減と利益向上を支援します。株式会社CREAが提供する「はたらくん」は、社内情報を素早く検索し、データ入力や書類作成などの繰り返し業務を自動化できる、生成AI活用型の業務効率化サービスです。顧客情報の整理やテンプレート作成、資料共有、情報の自動分類にも対応し、大手クラウドサービス利用により情報の安全性も確保しています。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| 50万円~ (詳細はお問合わせください) |
0円 | なし | なし |
Datatang株式会社(Nexdata)は、国内外100つの大規模言語モデルの開発に支援してきました。プレイトレーニングからファンチューニングまで、既製データセット・データ収集・アノテーションを一気貫通して提供しております。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| - | 0円 | AI学習用データサンプル無償提供 | AI学習用データサンプル無償提供 |
Datatang株式会社(Nexdata)が提供するデータセットの収集・購入「AI-OCR向け多言語学習データセット販売サービス」です。Datatangが提供する「AI-OCRデータセット」は、日本語、英語、中国語など世界50以上の言語をカバー、日本語英語混在・中国語英語混在などの多言語混在型も多数保有しております。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| - | 0円 | AI学習用データサンプル無償提供 | AI学習用データサンプル無償提供 |
Datatang株式会社(Nexdata)が提供する「顔認証・物体検出向け画像データセット」は、異なる人種(欧米人、アジア人、アフリカ人)姿勢、角度、マスク・メガネ・帽子など様々な状況をカバー、総計500万枚を超えています。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| - | 0円 | AI学習用データサンプル無償提供 | AI学習用データサンプル無償提供 |
Datatang株式会社(Nexdata)が提供する「音声認識データセット」は、朗読、会話コーパスなどをカバー、アジア、ヨーロッパ、アフリカなど総計100種類以上の言語コーパスを保有、様々な音声認識・合成タスクに対応可能です。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| - | 0円 | AI学習用データサンプル無償提供 | AI学習用データサンプル無償提供 |
ワンストップで丸ごと対応・専門的、特殊なデータもお任せ下さい。株式会社アマナイメージズが提供する「QleanDataset」は、データ開発をワンストップで支援。専門チームが多様なデータ制作から権利チェックまで対応し、商用利用も安心です。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| お問合せください | お問合せください | お問合せください | お問合せください |
123RFが提供する「機械学習ためデータセットソリューション」は業界で19年以上の経験を持ち、権利やクレームに関連するリスクを最小限に抑えたデータセットの提供をお約束します。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| お見積りベース | 0円~ | なし | あり(サンプルデータセット) |
トランシンクが提供する音声・画像・動画データセットは、既存パッケージから必要なだけ購入することができます。ゼロからプロジェクトを立ち上げることなく、必要なだけ購入し、AIモデルの開発ができます。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| 音声コーパス:15,000円 / 時間 人物写真画像収集:300円 / 画像 |
なし | なし | あり |
ソフトバンク株式会社が提供する「TASUKIアノテーションツール」は、アノテーション作業の課題を解決し、効率的で確実な作業を実現するためのツールです。豊富な自動アノテーション機能やWeb同期作業、安心のセキュリティという特徴を備えており、アノテーションを内製で実施したいお客様の幅広いニーズに対応しています。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| お問合せください | お問合せください | お問合せください | あり |
オフショア環境による圧倒的なコストパフォーマンス(2円~/Bbox)と 数々のBPO業務から培ったプロジェクト体制による高品質なデータ作成を特徴としたアノテーションサービスです。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| 1Bbox2円~( 案件の詳細をお伺いしお見積りいたします ) | お問合せください | なし | なし |
audioコーパス株式会社が提供する「audioコーパス データセット」は、発話音声および書き起こしテキストに、タグなどを付与したデータセットのパッケージ商品となります。 お好きな発話カテゴリよりお買い求めいただけます。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| 1分当たり350円(※データセット内容:wav/txt/eaf) | 0円 | サンプルデータをご提供します | あり |
ソフトバンク株式会社が提供する「TASUKI Annotation」は社内データの構造化の代行により、RAGの検索精度向上の支援を行います。特に、ChatGPT等のLLMが解釈を苦手としている図表などの情報も回答させることが可能になります。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| 案件詳細を伺ってお見積りいたします。 | なし | なし | なし |
事前学習用データの収集、専門人材によるデータ作成、RAG用データ作成など、生成AI開発におけるデータの課題を多方面からご支援します。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| ご要件を踏まえて、個別にご提案させていただきます。 | なし | なし | なし |
FastLabel株式会社が提供する「アノテーション代行サービス」は、高品質なデータを納得の費用と適切な納期でご提供。独自の管理手法でデリバリー品質を担保。ドメイン知識が必要な仕様にも対応可能です。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| ご要件を踏まえて、個別にご提案させていただきます。 | なし | なし | なし |
PTWが提供する「AIアノテーションサービス」は、お客様のご要望に柔軟に寄り添い、迅速で高品質なサービスを提供いたします。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| - | 0円~ | なし | なし |
lighthouse株式会社が提供するAIプラットフォーム「FUNNEL CORE」は実務に役立つ多彩な機能を備え、業務効率の向上や新たな価値創出をサポートします。
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| 月額10万円~ (20ユーザー以上) | 0円 | なし | あり(~5ユーザーまで) |
株式会社Nextremerが提供する「Nextremerアノテーションサービス」は、最高品質のデータアノテーションでAIアルゴリズムの真の価値を引き出すします
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| データ量、納期に基づく価格設定 | なし | なし | なし |
矢崎が雇用する"社員"がアノテーション作業を行うことで、超高品質を実現。80年を超える品質管理の実績が約束する、信頼性の高いアノテーション
| 利用料金 | 初期費用 | 無料プラン | 無料トライアル |
|---|---|---|---|
| 分類:¥5~ 短形:¥10~ キーポイント: ¥7~ ※料金は要件によって異なるため、お見積もりください |
初期費用なし | なし | 無償トライアルあり |
プロダクト資料をまとめて
比較・確認したい方はこちら
| 製品名 |
FastLabel Data Factory |
生成AI開発データ作成サービス |
harBest for Data |
|---|---|---|---|
| 機能 |
データ品質99.7%を実現する高品質な教師データ作成サービス |
LLMに特化したプロフェッショナル人材を登用しており、日本語のQ&Aなどのデータをゼロから作成することで権利リスクがない高品質なデータセットをご提供いたします。 |
特許出願済の品質自動評価機能を用い、画像・動画・文章・音声などデータ作成をWebで簡単に発注出来るアノテーションサービス。 |
| 利用料金 | ツールの初期費用やセットアップは不要で、すぐに使い始めることができます。 月額費用のみで利用でき、面倒なツールのメンテナンスも不要です。 |
ご要件を踏まえて、個別にご提案させていただきます。 | 通常ユーザ/Proユーザ 収集: 5円~/ 7円~ 分類: 2円~/ 3円~ 短形: 5円~/ 6円~ 多角形: 10円~ / 15円~ 塗潰し: 20円~ / 30円~ |
| 初期費用 | なし | なし | 0円(フリープランお申込で1,000point付与のキャンペーン実施) |
| 無料プラン | |||
| 無料 トライアル |
|||
| 製品リンク |
「FastLabel Data Factory」の 詳細はこちら |
「生成AI開発データ作成サービス」の 詳細はこちら |
「harBest for Data」の 詳細はこちら |
教師データ作成サービスを円滑に導入するためには、データ収集とアノテーションの作業が必要です。教師データ作成では、まず素材となるデータを収集します。収集する対象のデータは、画像・動画・音声・テキストなど多岐に渡ります。質の高いデータを大量に用意するようにしましょう。
次に、そのデータに適切な情報を付加する作業が必要です。この作業はアノテーションと呼ばれ、AIの精度を左右する重要な作業です。
アノテーションの要件を明確にするためには、アノテーションの種類・対象物・作業のルールを検討しなければなりません。ここからは、アノテーションの種類や教師データの種類などをご紹介していきます。
画像アノテーションの種類としては、主に以下の5つが挙げられます。
画像・動画の中に映っているものを検出し、言葉に意味を付けていくという手法です。
特定の領域を選択して、タグ付けを行っていく作業のことです。
画像・映像に映った物体の領域を多角形で囲っていくアノテーション手法のことです。
顔認識において多く利用されるアノテーション手法です。顔の表情から感情を読み取るAIなどで多く用いられます。
1枚の画像にタグ付けを行っていくシンプルな手法です。
AIには、機械学習という要素技術が存在します。その機械学習は、データの種類や状況などに応じて「教師あり学習」「教師なし学習」「強化学習」という3つに分けることができ、教師データは「教師あり学習」において必要となるデータとなるわけです。
教師あり学習とは、その名の通り、教師となるデータをもとに学習していくものであり、不明なデータを持ち寄った場合には正解を教えてくれるというイメージで問題ありません。そのため、正解となるデータを大量に学習していくことで、新しいデータにも対応することができるようになるのです。
そんな教師あり学習は、「学習」「認識・予測」という2つのプロセスによって成り立っています。1つ目のプロセスである「学習」では、正解のデータを用いてルールやパターンの学習を行っていくわけです。そして2つ目のプロセスである「認識・予測」では、新しくインプットされた「まだ正解がわからないデータ」に対して、これまでに学習したデータを用いて認識・予測を行っていきます。
では、教師データ作成サービスを導入する場合、どのような点に着目して選んでいけば良いのでしょうか。ここからは、教師データ作成サービスの選び方についてご紹介していきます。
教師データの品質を保つために「作業ルール」は統一しましょう。作業ルールがアノテーターごと異なっていると、データの品質にばらつきがでてしまいます。作業ルールの統一化を図る方法には、ガイドラインの作成があります。
ガイドラインには、作業ルールや作業時の注意点を取り纏めるようにしましょう。また、作成したガイドラインは、チーム全員で共有しておくことも重要です。

ガイドラインを自社で作成しサービス提供会社に支給するのか、ガイドラインの作成も含めて依頼するのか、自社の知見や予算に合わせて判断すると良いでしょう。
まずは、データをどのような方法で収集するか検討していきます。代表的な方法としては、以下のようなものが挙げられるでしょう。
社内には顧客データや売り上げデータ、文書データ、機械のセンサデータなど、さまざまなデータが蓄積されています。それらを活用してAIに学習させることで、より業務効率化を推進することができるでしょう。
画像データを必要とするAIを構築する場合には、動画から画像データを集める方法が有効です。そもそも動画は、画像データをパラパラ漫画のように連続で表示させてアニメーションにしたものであるため、フレームレートが30fpsの30分の動画からは約5万4,000枚の画像データが収集できます。
専門知識を持つ担当者が存在しない場合には、社内で教師データを作成していくのが難しいケースもあるでしょう。教師データ作成は、AI開発における最大の関門と言っても過言ではないほどハードルが高く、多くの時間を費やさなくてはなりません。無理に教師データ作成を自社で進めようとしてしまうと、大幅な時間ロスが生じてしまう可能性もあるのです。
そのため、できるだけ効率的に教師データ作成を進めていくために、データセットやコーパスを購入するというのも一つの手段です。
AIの精度を向上させる上で、教師データの収集は欠かせません。AIが分析・予測を行うためには、正解となるデータが必要になるからです。そのため、教師データが多くなるほど、AIの精度も向上していくと考えられています。
しかし、データの量だけが多ければ良いというわけでもありません。教師データをもとに学習を行っていく以上、正解となるデータの質が悪ければ学習精度も低下してしまうからです。AIの学習には多くの時間を要するため、質の低いデータを用いてしまうと、その学習時間がすべて無駄になってしまう可能性も否めません。
そこで必要となるのが、訓練データとテストデータの2つです。手持ちのデータをすべて学習用データとして使用すると、過度に適合したモデルが出来上がってしまい、逆に精度が低下してしまうことも少なくありません。こういった「過学習」と呼ばれる減少を避けるためにも、訓練データとテストデータに分けることが重要です。
サービスを検討する際に気になるのが費用です。一般的に、教師データ作成サービス費用の内訳は「業務委託費」「品質管理費」「プロジェクト管理」に分けられます。ここでは、それぞれの内訳について説明します。
業務委託費の大半を占めるのが、教師データ作成にかかる人件費です。業務委託費は、対象データの種類やアノテーションの要件によって変動します。また会社によって料金設定も異なるため、複数の会社を比較・検討し相場を把握することをおすすめします。
また依頼する量が多い場合は「ボリュームディスカウント」が適用される会社もありますので、併せて確認すると良いでしょう。
教師データの作成には膨大な量のアノテーションが必要になるため、アノテーション業務の品質を一定水準に保てるよう品質管理を行うことが重要です。品質管理の方法は、主に以下の3つに分けられます。

予算との兼ね合いも大切ですが、教師データの品質が一定水準に満たないとAIの精度が上がらないことも考慮しなければいけません。価格の安さのみに注目せず、品質も考慮した上で自社に合った管理方法を選択すると良いでしょう。
プロジェクト管理費には、プロジェクトの進捗管理や人材管理が含まれます。プロジェクト管理を自社で行える場合は、内製化することで予算を抑えることができます。自社内にプロジェクトを管理するノウハウやリソースがない場合は、外部に任せることも検討しましょう。
プロジェクトの管理では、自社内のリソース状況に応じて依頼範囲を見極めることが重要です。
以上のように、教師データ作成サービス費用は「何を依頼するのか」「どこまでの範囲を依頼するのか」などの条件により変動します。自社で担当する範囲と依頼する範囲を検討し、複数の会社を比較することが大切です。
教師データの作成のために使用するデータは、個人情報が含まれることも多いためセキュリティ対策をしっかり行う必要があります。

教師データ作成サービスの中には、クラウドワーカーやオフショアを利用している会社も少なくありません。クラウドワーカーやオフショアを利用しているサービスの場合は、「どのようなセキュリティ対策をしているのか」「情報漏えいへの対策がきちんと施されているか」など、提携している個人や委託先からを確認しておくと良いでしょう。
※クラウドワーカーとは…業務の発注者と受注者を仲介するサービス「クラウドソーシング」を用いて働く人のこと
※オフショアとは…海外の提携先に業務を委託すること
教師データの作成を行うためには、大量の生データや生データをもとに生成した学習用データセットが必要です。その際に、文章や画像、動画といった著作物(生データ)を利用することもあるでしょう。
著作権法上、著作権者の許可なく無断で著作物を利用(ダウンロードや改変等)することはできません。ただし、現在の著作権法には第三十条の四が存在するため、AIの開発を目的とした場合であれば、一定限度で著作権者の許諾なく著作物を利用することができます。著作権法における「第三十条の四」の条文は、以下の通りです。
(参考)著作権法 第三十条の四
第三十条の四 著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りではない。
また、教師データを集める上では、プライバシーへの配慮も必要です。特に、画像データや動画データを扱う際には、本人が気付かぬうちにパーソナルデータを収集してしまうというプライバシー侵害のリスクもあるため、注意する必要があります。
より大量の教師データを収集したほうが高精度のAIを構築できるわけですが、ただ大量に教師データを集めれば良いというわけではありません。場合によっては、プライバシー侵害に該当してしまうケースもあるため、注意しながら進めていく必要があるでしょう。
ここまでにご紹介した条件を照らし合わせながらサービスを選定すると、教師データ作成サービスの導入に失敗するリスクを抑えることが可能になります。なお、アイスマイリーでは、教師データ作成サービスの選定に役立つDX雑誌やサービス比較表なども無料でお配りしていますので、ぜひこちらも併せて参考にしてみてください。
アイスマイリーでは、AIを開発する際に必要不可欠なアノテーションの事例やユースケースを紹介したDX雑誌「AI教師データ作成のキーポイント」を無料で配布しています。
本資料では、実績のあるAI企業5社が画像データのアノテーションをメインにアノテーション作業のコツを踏まえながら事例やユースケースを紹介していきます。
AIデータ作成を検討される際には、ぜひこちらのDX雑誌「AI教師データ作成のキーポイント」をご活用ください。
DX雑誌「AI教師データ作成のキーポイント」をダウンロードされたい方は[DX雑誌「AI教師データ作成のキーポイント」を無料でダウンロードする]ボタンより無料でダウンロードできます。
お問い合わせ内容欄に「AI教師データ作成のキーポイント」と記載の上、送信してください。
数ある「教師データ作成サービス」の中から、自社の課題や導入の目的にあった「教師データ作成サービス」を選び出すのは容易ではありません。そんな時に役立つのが、サービスの種類別にセグメントされた教師データ作成サービスAIカオスマップです。

この便利なカオスマップを含む教師データ作成サービス比較表と掲載サービス7選は、以下の「教師データ作成サービス比較表と掲載サービス7選を無料でダウンロードする」ボタンより無料でダウンロードできます。
教師データ作成サービスを円滑に導入するためには、データ収集とアノテーションの作業が必要です。そのため、画像アノテーションの種類や教師データについて、正しく理解しておく必要があります。
また、企業によって予算も大きく異なるため、導入前の段階でサービス導入の費用感も理解しておくと良いでしょう。
なお、教師データ作成サービスは導入がゴールではありません。運用していく中で「AIの精度がなかなか上がらない」「精度が下がってきた」といったことも起こり得ます。このような時のために、下記の運用のポイントを押さえておくと良いでしょう。
教師データ作成の際には、通常ガイドラインを作成しチームで共有します。AIの精度に問題が発生した際は、以下を確認してみましょう。

教師データ作成はAIの精度維持・向上において非常に重要なパートです。定期的に「ガイドラインを順守できているか」や「アップデートの必要がないか」を見直すと良いでしょう。
無料
全サービス資料請求
目的から探す
業務の課題解決に繋がる最新DX・AI関連情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
実際のメールマガジン内容はこちらをご覧ください。