概要
タイトル(言語)
アッサム言語データセット
データセットの種類
コールセンター、一般会話、メディアデータ(ポッドキャストデータ)
国
インド
詳細説明
エージェントと顧客間の台本のない合成電話会話は、約5分から15分程度でご利用いただけます。さらに、1人から5人の参加者によるインタビュー、ポッドキャスト、その他類似コンテンツなど、ライセンス可能なパブリックドメインの音声または動画ファイルも、約15分から60分程度でご利用いただけます。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
データセットの詳細
| データセットのタイプ | サンプリング・レート | スピーカー | チャネル | 合計時間 | 講演者の総数 |
|---|---|---|---|---|---|
| センターに電話 | 44kHz | 2スピーカー | デュアル | 35:41:55 | 420 |
| 一般的な会話 | 8kHz | 2スピーカー | デュアル | 96:24:41 | 252 |
| メディアデータ | 16kHz | 複数のスピーカー | Mono | 28:41:59 | 122 |
注目のクライアント
チームが世界をリードするAI製品を構築できるようにします。
探しているものが見つかりませんか?
新しい既製のデータセットがすべてのデータ タイプにわたって収集されています
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください