タイトル(言語)
マラーティー語データセット
データセットの種類
コールセンター、一般会話、メディア(ポッドキャスト)、台本付きモノローグ
国
インド
詳細説明
このデータセットには、台本のない合成エージェントと顧客の電話での会話(5〜15分)、自然な人間同士の電話での会話(15〜60分)、および書き起こし付きの歌の音声が含まれており、音声および言語技術のトレーニングと評価のための多様な音声データを提供します。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
| データセットのタイプ | サンプリング・レート | スピーカー | チャネル | 合計時間 | 講演者の総数 |
|---|---|---|---|---|---|
| センターに電話 | 8kHz | 2スピーカー | デュアル | 70:28:58 | 634 |
| 一般的な会話 | 8kHz | 2スピーカー | デュアル | 159:21:13 | 298 |
| メディアデータ | 16kHz | 多言語話者 | Mono | 24:09:24 | 94 |
| スクリプト化された独白 | 24kHz | シングルスピーカー | Mono | 3,900:00:00 | 要求に応じて |
チームが世界をリードするAI製品を構築できるようにします。
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください