概要
タイトル(言語)
カンナダ語データセット
データセットの種類
コールセンター、一般会話、メディアデータ、台本付きモノローグ
国
インド
詳細説明
このデータセットには、台本のない合成エージェントと顧客の電話での会話 (5〜15 分)、1〜5 人の参加者によるインタビューやポッドキャスト (15〜60 分) などのライセンス可能なパブリック ドメインの音声または動画ファイル、および 1 人の話者が音声および言語モデルのトレーニングと評価用に事前定義されたコンテンツを提供する台本付きの独白が含まれます。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
データセットの詳細
| データセットのタイプ | サンプリング・レート | スピーカー | チャネル | 合計時間 | 講演者の総数 |
|---|---|---|---|---|---|
| センターに電話 | 8kHz | 2スピーカー | デュアル | 59:57:02 | 494 |
| センターに電話 | 16kHz | 2スピーカー | Mono | 195:26:56 | 9,504 |
| 一般的な会話 | 8kHz | 2スピーカー | デュアル | 141:27:15 | 424 |
| メディアデータ | 16kHz | 複数のスピーカー | Mono | 14:19:52 | 124 |
| スクリプト化された独白 | 24kHz | シングルスピーカー | Mono | 500:00:00 | 要求に応じて |
注目のクライアント
チームが世界をリードするAI製品を構築できるようにします。
探しているものが見つかりませんか?
新しい既製のデータセットがすべてのデータ タイプにわたって収集されています
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください