DXを推進するAIポータルメディア「AIsmiley」| AI製品・サービスの比較・検索サイト
03-6452-4750 10:00〜18:00 年末年始除く
企業名:audioコーパス株式会社 カテゴリ名: アノテーション 製品名:audioコーパス データセット

お急ぎの方は、まずお電話で 03-6452-4750 10:00〜18:00 年末年始除く
お急ぎの方は、まずお電話で03-6452-4750

パッケージ化したデータセットをオンライン販売

音声認識AIの
学習用データセット
「audioコーパス」

audioコーパス株式会社が提供する「audioコーパス データセット」は、発話音声および書き起こしテキストに、タグなどを付与したデータセットのパッケージ商品となります。 お好きな発話カテゴリよりお買い求めいただけます。

3つのPOINT

  1. POINT01

    発話収録のプロ

    audioコーパスは、さまざまな発話カテゴリのデータセットを取り扱っています。自社リソースで収録、知的財産権など権利関係の利用許諾が取れた正規データを販売。安全にご利用いただけるリアリティある発話データです。
    point1
    point1
  2. POINT02

    書き起こしのプロ

    audioコーパスの書き起こしは、表記の「ゆらぎ」がありません。記者やライターが用いる記者ハンドブック(共同通信社発刊)の仕様に準じ、熟練され表記統一されたプロ仕様による書き起こしデータです。
    point2
    point2
  3. POINT03

    コーパスのプロ

    audioコーパスでは、AI学習用途のタグを付与。「フィラー(F)」「言い直し(D)」「延伸(:)」「笑い<笑>」「不明瞭(?)」をラベリング、音声認識にとってノイズとなりうる言語情報を可視化しています。
    point3
    point3

データセット購入の費用対効果

音声認識エンジンには学習用の教師データが欠かせません。

教師データ作成の流れは、一般的には自社で録音データを用意し、書き起こし業者に業務委託、1~2カ月ほどの作業期間を経て、データを完成させます。

「人手でデータ作成するんだから、お金と時間がかかるのは当たり前」

そう思われてる方が多いですが、ポイントは3つあります。それは、1.コスト 2.品質 3.発話の偏り です。

教師データ作成で考えるべき3つのポイント

  1. コスト
    音声から書き起こしを行い、アノテーション付与するため、作業が複雑化し高価格になりやすいです。請負業者(※元業者の立場から)としては、作業に手間がかかるため、作業期間を長く、単価は高く、見積もりたいのが本音です。
  2. 品質
    書き起こし品質と、アノテーション品質には求められるスキルが異なります。書き起こしは文章力・言語力を評価し、アノテーションは正確性・確実性を評価する。文系・理系ほどの違いがあります。これを高品質に両立できる請負業者はほとんどいません。
  3. 発話の偏り
    開発したい発話カテゴリの音声が自由に使用できないことです。社内で録音したものなら許諾が得やすいですが、社外の商談やカスタマー受付の音声は利用できないケースがほとんどです。

audioコーパスなら

商品をパッケージ化することで、比率の高い原価を吸収。即時納品に対応します。
文字起こし業界10年以上の知見、音声認識AIに特化した豊富な書き起こし実績による監修。
AI開発現場の生の声から、今求められてる発話カテゴリを製作。

音声認識AI市場のパートナーとしてオンリーワンの存在となります。

即納!安い!高品質!

audioコーパス データセットは、1分当たり350円(税抜)となります。
※データセット内容:音声データ(wav)音声)/テキストデータ(txt/eaf)

音声データ…カスタマー、オペレーターにてステレオ録音された2チャンネル音源です
テキストデータ…書き起こし、区間区切り、タグ付与されたテキストデータです

即納!安い!高品質!

即時納入…データはすぐにご利用いただけます。
区切りマージン200msec…発話の始端と終端のタイムスタンプの誤差は0.2秒以内に抑えます。
表記統一・ゆらぎ防止…書き起こしプロフェッショナルにより、言葉のゆらぎを防ぎます。
6つのアノテーションタグ…フィラー、言い直し、延伸、聞き取り不明、未確証、笑いのタグを付与。
品質担保…初稿作業、校正作業、チェッカーによるトリプルチェック体制。
カスタマイズ対応…ご要望の仕様にも対応いたします。

audioコーパスが解決したいお悩みごと

従来、書き起こし市場の相場として、請負業者に文字起こしを依頼すると1分当たり300円(税抜)ほどの外注費がかかります。
この300円は、音声から文字に起こす費用のみとなるので、これにアノテーション要件を追加すると、2倍近くに増額することも珍しくありません。
さらに、音声データはご自身で用意し、仕上がりの納期まで待たなくてはいけません。

audioコーパス株式会社は「音声認識のブースターに」を企業理念に、高品質なデータセットを即納することで、音声認識AI市場を後方より支援します。

audioコーパスが解決したいお悩みごと

音声認識AIの学習用 audioコーパス データセット

購入ステップはシンプル!
ご希望の「発話カテゴリ」と「購入データ量」をお申し付けください。

  • 発話カテゴリ
    商談・インサイドセールス・受注問い合わせ・物品購入・カスタマーサポート etc
  • 購入データ量
    1時間/10時間/100時間 etc
  • 購入金額
    1分当たり350円(税抜)
    ※サンプル見本をお送りしますので内容をご確認の上ご購入いただけます

音声認識AIの学習用 audioコーパス データセット

お客様の声

  • IT大手研究所様(※リピートあり)
    「AI学習用データは自社で作成するしかないと思ってたので、御社からパッケージされたデータセットを購入できて開発スピードが上がりました」
  • 電機メーカー大手
    「自社で自由に使える会話データ(※利用許諾を得たもの)には偏りがあって、とくにB2Bの女性の発話サンプルがほしかったので、購入できて大変助かりました」

担当者の声

代表より「会社設立のきっかけは、著作権フリーの発話データが市場にとても少なかったことです。人の声というのは、肖像権また個人情報としても権利が守られているものになります。もちろん無許可で利用することはできません。ぜひパッケージされた安心安全・高品質なaudioコーパスを利用して、AI開発に取り組んでいただけたら幸いです」

利用料金

利用料金
1分当たり350円(※データセット内容:wav/txt/eaf)
初期費用
0円
無料プラン
サンプルデータをご提供します
無料トライアル
あり

音声認識AIの
学習用データセット
「audioコーパス」

製品概要

audioコーパス データセット

製品説明

audioコーパス株式会社が提供する「audioコーパス データセット」は、発話音声および書き起こしテキストに、タグなどを付与したデータセットのパッケージ商品となります。 お好きな発話カテゴリよりお買い求めいただけます。

カテゴリ
目的
  • データ分析
  • 問い合わせ対応
  • パーソナライズ
  • 受付
  • 販売
  • 業務改善(効率化)
  • 品質・保全支援
  • コスト削減
  • お客様の声(VOC)分析
  • 営業支援
  • 満足度向上
  • ユーザーエクスペリエンス向上
  • アノテーション作業請負業務
  • AI研究開発支援
  • 付加価値
  • 物件の価値向上
  • コールセンター
  • 感情認識・感情解析
対象業界
  • 人材
  • IT
  • コールセンター
  • バックオフィス
  • 保険
  • Webサービス
  • 医療
  • 広告
  • コンサルティング
  • 通信
規模
  • 大企業向け
  • 中小企業向け

会社概要

audioコーパス株式会社

住所
〒171-0021東京都豊島区西池袋2-37-4 IKE・Biz 4F
資本金
-
設立年月
2022年7月
従業員数
-
事業内容
「音声認識のブースターに」を企業理念に、音声認識AIに学習させるデータ製作を専門とする会社です。プロフェッショナルな書き起こし仕様とアノテーション仕様を融合させ、音声認識エンジンの支援を行っています。

アノテーションの関連製品はこちら

product-logo

TASUKIアノテーションツール

TASUKI
アノテーションツール

ソフトバンク株式会社
product-logo

AI受託開発・データ分析支援

AI受託開発・データ分析支援

株式会社MiDATA
product-logo

AIソリューション(受託開発/PoC&コンサル)

AIソリューション
(受託開発/PoC&コンサル)

株式会社オルツ
product-logo

矢崎の画像アノテーションサービス

矢崎の
画像アノテーションサービス

矢崎総業株式会社

AI活用のご相談したい企業様はこちら

03-6452-4750

AI製品・ソリューションの掲載を
希望される企業様はこちら