タイトル(言語)
マレー語データセット
データセットの種類
コールセンター、一般会話、メディアデータ(ポッドキャストデータ)
国
マレーシア、インドネシア、ブルネイ、シンガポール
詳細説明
マレーシアのマレー語による 2 人の人物間の台本のない電話会話が 15 分から 60 分の範囲で利用可能です。また、参加者が 1 人から 5 人までのインタビューやポッドキャストなど、同じく 15 分から 60 分の範囲でライセンス可能なパブリック ドメインの音声ファイルや動画ファイルも利用可能です。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
| データセットのタイプ | サンプリング・レート | スピーカー | チャネル | 合計時間 | 講演者の総数 |
|---|---|---|---|---|---|
| 一般的な会話 | 8kHz | 2スピーカー | デュアル | 239:49:43 | 432 |
| 一般的な会話 | 48kHz | 2スピーカー | Mono | 90:19:23 | 140 |
| メディアデータ | 16kHz | 多言語話者 | Mono | 343:57:16 | 907 |
| センターに電話 | 8kHz | 2スピーカー | Mono | 2,000:00:00 | 要求に応じて |
チームが世界をリードするAI製品を構築できるようにします。
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください