
ScribeAssist
ScribeAssist
株式会社アドバンスト・メディア
データ収集・アノテーション不要な
既製データセット
Datatang株式会社(Nexdata)が提供する「音声認識データセット」は、朗読、会話コーパスなどをカバー、アジア、ヨーロッパ、アフリカなど総計100種類以上の言語コーパスを保有、様々な音声認識・合成タスクに対応可能です。
13年積み上げてきた大規模コーパス
Datatangの自社版権音声データセットは、100以上の言語をカバーし、100万時間を超えています。サンプリング周波数、話者、トピックが多様で、豊富なドメインをカバーしています。トップ企業に信頼される高精度
世界トップ大手会社に信頼される高精度。全てネーティブスピーカーにより収集された自然会話、朗読などで、収集環境・話題・性別・年齢層などの多様性に配慮しており、文字起こし、話者などにアノテーション済みです。業界最先端に合わせて随時更新
教師なし学習向け大規模音声データ・多言語TTSデータ・複数話者の会話・感情音声データ・音声合成・変換多言語コーパス・多業界・ファインチューニング向けなど音声認識の業界最先端タスクにフル対応可能です。豊富なデータセットに感心です。激しいAI競争に勝ち抜くにはやはり高精度な学習データセットが不可欠です。お陰様で開発の効率も大幅に向上しました。
【代表のメッセージ】
Datatang株式会社は2020年2月に日本市場でAIデータサービスの展開を開始します。
これまで、中国、米国、韓国でサービスを展開する中で、1000社近くの先進的なお客様とお取引をして、世界トップクラスのAIサービスプロバイダーとしての実績と評価を頂いてきました。
日本は米国、中国と並んで、AI(人工知能)マーケットの急速な拡大が想定されます。
自動車や電機、エネルギー、金融、流通等の産業の各分野でそこにある様々な課題に対応するためAIの活用が進んできます。
その発展には、データが中心的な役割を果たし、データはAIを駆動させます。
Datatang株式会社は、AI(人工知能)の学習用データ整備に特化しております。AIの性能を高めるために、必要なデータの採集と加工をしてご提供します。また各国の規制やセキュリティの課題にも対処しております。
具体的には2つのコアコンピタンスがあります。
一つはデータの採集・自動加工(アノテーション)・品質コントロール・納品のプロセスを効率よく実現できるプラットフォームを持っていることです。もう一つは、版権(データ提供者の許諾)とセキュリティをクリアした画像・動画や音声のデータを2.5PB保有していることです。
これはAIデータサービス会社が保有する世界最大のデータ量です。
日本のデジタルトランスフォーメーション化の流れの中でこれまでAIと接点の薄かった業種・業態でもAIを活用したビジネス改革が進みます。この推進でネックになるのが、データ収集、またデータの加工整備(アノテーション)に莫大な工数が掛かることです。この部分を高い品質でサービスを提供することで、日本の産業界のAI活用、そしてその発展に貢献して行くことが使命であり、存在する価値であると思い、日本市場でのサービスを開始しました。
Datatang株式会社
代表取締役社長 何 鴻凌
Datatang株式会社(Nexdata)が提供する「音声認識データセット」は、朗読、会話コーパスなどをカバー、アジア、ヨーロッパ、アフリカなど総計100種類以上の言語コーパスを保有、様々な音声認識・合成タスクに対応可能です。
AI製品・ソリューションの掲載を
希望される企業様はこちら