AIおよび音声モデル向けの高品質スワヒリ語コールセンターおよびメディア(ポッドキャスト)データセット
タイトル(言語)
スワヒリ語データセット
データセットの種類
コールセンター、メディア(ポッドキャスト)
国
タンザニア、ケニア、ウガンダ
詳細説明
このデータセットには、台本のない合成エージェントと顧客の電話での会話 (5〜15 分) と、1〜5 人の参加者によるインタビューやポッドキャスト (15〜60 分) などのライセンス可能なパブリック ドメインの音声または動画ファイルが含まれています。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
| データセットのタイプ | サンプリング・レート | スピーカー | チャネル | 合計時間 | 講演者の総数 |
|---|---|---|---|---|---|
| センターに電話 | 8kHz | 2スピーカー | デュアル | 229:59:55 | 544 |
| 音楽 | 16kHz | 複数のスピーカー | Mono | 264:34:45 | 636 |
チームが世界をリードするAI製品を構築できるようにします。
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください