タイトル(言語)
ニューヨーク英語言語データセット
データセットの種類
コールセンター、一般会話、メディア(ポッドキャスト)
国
米国
詳細説明
このデータセットは、台本のない合成エージェントと顧客の会話(5〜15 分)、人間同士の電話での会話(15〜60 分)、書き起こし付きの歌唱音声、インタビュー、ポッドキャスト、台本付きの独白など、多様な音声およびメディア コンテンツを提供しており、音声および言語技術のトレーニングと評価をサポートします。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
| データセットのタイプ | サンプリング・レート | スピーカー | チャネル | 合計時間 | 講演者の総数 |
|---|---|---|---|---|---|
| センターに電話 | 8kHz | 2スピーカー | デュアル | 117:40:09 | 1,388 |
| 一般的な会話 | 8kHz | 2スピーカー | デュアル | 156:42:48 | 510 |
| 音楽 | 16kHz | シングルスピーカー | Mono | 135:14:18 | 288 |
チームが世界をリードするAI製品を構築できるようにします。
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください