音声認識向け多言語音声コーパス販売サービス

Datatang株式会社（Nexdata）が提供する「音声認識データセット」は、朗読、会話コーパスなどをカバー、アジア、ヨーロッパ、アフリカなど総計100種類以上の言語コーパスを保有、様々な音声認識・合成タスクに対応可能です。

最短30秒で申込み完了!

無料で資料請求する

最短30秒で申込み完了!

無料で資料請求する

3つのPOINT

13年積み上げてきた大規模コーパス
Datatangの自社版権音声データセットは、100以上の言語をカバーし、100万時間を超えています。サンプリング周波数、話者、トピックが多様で、豊富なドメインをカバーしています。
トップ企業に信頼される高精度
世界トップ大手会社に信頼される高精度。全てネーティブスピーカーにより収集された自然会話、朗読などで、収集環境・話題・性別・年齢層などの多様性に配慮しており、文字起こし、話者などにアノテーション済みです。
業界最先端に合わせて随時更新
教師なし学習向け大規模音声データ・多言語TTSデータ・複数話者の会話・感情音声データ・音声合成・変換多言語コーパス・多業界・ファインチューニング向けなど音声認識の業界最先端タスクにフル対応可能です。

Japanese(Japan) Spontaneous Dialogue Smartphone speech dataset

データ作成・アノテーション不要な既製データセット

80％以上のデータニーズを既製データセットで対応可能　
一からデータ作成・収集・アノテーション作業は不要　
最短一週間で納品可能なハイスピード

データセットの一覧

教師なし学習向け大規模音声データ(日本語、英語、韓国語、フランス語、アラビア語、ドイツ語、スペイン語、ポルトガル語、各言語10万時間以上)
多言語TTSデータ(イントネーション、リズム、ポーズ、声質、感情などのパラ言語、韻律のラベル付け済み)
複数話者の会話・感情音声データ＆音声合成・音声変換向け多言語コーパス（日本語、英語、中国語及ぶその方言）
業界向け自然会話音声データ(金融、医療業界など、日本語、英語、スペイン語、ポルトガル語、フランス語、ドイツ語)
8kHz/16kHz/48kHz ファインチューニング会話音声データ(60言語以上をカバー)
ファインチューニングテキストデータ（日本語、英語、中国語、フランス語、スペイン語、ポルトガル語、ドイツ語、韓国語、イタリア語）

高精度データセットを素早く入手

公式サイトにてお気に入りのデータセットを検索
データ仕様・サンプルをチェックする
見積依頼＆発注　
データセット納品
データセットの検収

お客様の声

豊富なデータセットに感心です。激しいAI競争に勝ち抜くにはやはり高精度な学習データセットが不可欠です。お陰様で開発の効率も大幅に向上しました。

担当者の声

【代表のメッセージ】
Datatang株式会社は2020年2月に日本市場でAIデータサービスの展開を開始します。

これまで、中国、米国、韓国でサービスを展開する中で、1000社近くの先進的なお客様とお取引をして、世界トップクラスのAIサービスプロバイダーとしての実績と評価を頂いてきました。

日本は米国、中国と並んで、AI（人工知能）マーケットの急速な拡大が想定されます。

自動車や電機、エネルギー、金融、流通等の産業の各分野でそこにある様々な課題に対応するためAIの活用が進んできます。

その発展には、データが中心的な役割を果たし、データはAIを駆動させます。

Datatang株式会社は、AI(人工知能）の学習用データ整備に特化しております。AIの性能を高めるために、必要なデータの採集と加工をしてご提供します。また各国の規制やセキュリティの課題にも対処しております。

具体的には２つのコアコンピタンスがあります。

一つはデータの採集・自動加工（アノテーション）・品質コントロール・納品のプロセスを効率よく実現できるプラットフォームを持っていることです。もう一つは、版権（データ提供者の許諾）とセキュリティをクリアした画像・動画や音声のデータを2.5PB保有していることです。

これはAIデータサービス会社が保有する世界最大のデータ量です。

日本のデジタルトランスフォーメーション化の流れの中でこれまでAIと接点の薄かった業種・業態でもAIを活用したビジネス改革が進みます。この推進でネックになるのが、データ収集、またデータの加工整備（アノテーション）に莫大な工数が掛かることです。この部分を高い品質でサービスを提供することで、日本の産業界のAI活用、そしてその発展に貢献して行くことが使命であり、存在する価値であると思い、日本市場でのサービスを開始しました。

Datatang株式会社
代表取締役社長　何　鴻凌