概要
タイトル(言語)
米国英語データセット
データセットの種類
コールセンター、メディア(ポッドキャスト)、医療
国
米国
詳細説明
このデータセットには、台本のない合成エージェントと顧客の会話(5〜15 分)、1〜5 人の参加者によるインタビューやポッドキャスト(15〜60 分)などのライセンス可能なパブリック ドメインの音声または動画ファイル、および包括的な音声と言語の研究のためのメディアおよび医療データセット タイプが含まれています。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
データセットの詳細
| データセットのタイプ | サンプリング・レート | スピーカー | チャネル | 合計時間 | 講演者の総数 |
|---|---|---|---|---|---|
| センターに電話 | 8kHz | 2スピーカー | Mono | 10,196:00:00 | 1,052 |
| センターに電話 | 8kHz | 2スピーカー | デュアル | 597:26:43 | 要求に応じて |
| メディアデータ | 16kHz | 複数のスピーカー | Mono | 620:23:43 | 5,466 |
| 医療 | 8kHz | 2スピーカー | Mono | 1,480:30:33 | 697 |
注目のクライアント
チームが世界をリードするAI製品を構築できるようにします。
探しているものが見つかりませんか?
新しい既製のデータセットがすべてのデータ タイプにわたって収集されています
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください