タイトル(言語)
グジャラート語データセット
データセットの種類
コールセンター、一般会話、メディアデータ(ポッドキャストデータ)
国
インド
詳細説明
エージェントと顧客間の台本のない合成電話会話は 5 ~ 15 分間利用可能です。一方、1 ~ 5 人の参加者によるインタビューやポッドキャストなど、ライセンス可能なパブリック ドメインのオーディオ ファイルやビデオ ファイルは通常 15 ~ 60 分間です。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
| データセットのタイプ | サンプリング・レート | スピーカー | チャネル | 合計時間 | 講演者の総数 |
|---|---|---|---|---|---|
| センターに電話 | 8kHz | 2スピーカー | デュアル | 54:22:40 | 410 |
| 一般的な会話 | 8kHz | 2スピーカー | デュアル | 149:15:19 | 308 |
| メディアデータ | 16kHz | 複数のスピーカー | Mono | 26:04:30 | 102 |
チームが世界をリードするAI製品を構築できるようにします。
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください