概要
タイトル(言語)
ヒンディー語データセット
データセットの種類
コールセンター、一般会話、メディア(ポッドキャスト)、台本付きモノローグ
国
インド
詳細説明
2人による15分から60分までの台本のない電話会話に加え、同じ時間帯の1人から5人までの参加者によるインタビューやポッドキャストなど、ライセンス可能なパブリックドメインの音声・動画ファイルもご利用いただけます。さらに、単一発話の録音は通常5秒から30秒で、台本付きの独白データもご利用いただけます。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
データセットの詳細
| データセットのタイプ | サンプリング・レート | スピーカー | チャネル | 合計時間 | 講演者の総数 |
|---|---|---|---|---|---|
| センターに電話 | 8kHz | 2スピーカー | デュアル | 70:45:51 | 要求に応じて |
| センターに電話 | 8kHz | 2スピーカー | Mono | 20,000:00:00 | 要求に応じて |
| センターに電話 | 16kHz | 2スピーカー | Mono | 29:17:20 | 261 |
| センターに電話 | 16kHz | 2スピーカー | デュアル | 400:27:10 | 1200 |
| 一般的な会話 | 8kHz | 2スピーカー | デュアル | 47:48:40 | 224 |
| メディアデータ | 16kHz | 複数のスピーカー | Mono | 227:57:43 | 438 |
| スクリプト化された独白 | 48kHz | シングルスピーカー | Mono | 2,866:00:00 | 3,988 |
| スクリプト化された独白 | 24kHz | シングルスピーカー | Mono | 29,000:00:00 | 要求に応じて |
注目のクライアント
チームが世界をリードするAI製品を構築できるようにします。
探しているものが見つかりませんか?
新しい既製のデータセットがすべてのデータ タイプにわたって収集されています
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください