タイトル(言語)
タイ語データセット
データセットの種類
一般的な会話、メディア(ポッドキャスト)、台本付きモノローグ
国
タイ
詳細説明
このデータセットには、イスラエルのヘブライ語による 2 人の人物間の台本のない電話会話 (15〜60 分)、1 人から 5 人の参加者によるライセンス可能なパブリック ドメインの音声または動画ファイル (15〜60 分)、および音声および言語モデルのトレーニングと評価のために 1 人の話者が定義済みのコンテンツを提供する台本付きの独白が含まれています。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
| データセットのタイプ | サンプリング・レート | スピーカー | チャネル | 合計時間 | 講演者の総数 |
|---|---|---|---|---|---|
| 一般的な会話 | 8kHz | 2スピーカー | デュアル | 211:48:42 | 170 |
| メディアデータ | 16kHz | シングルスピーカー | Mono | 249:14:31 | 670 |
| スクリプト化された独白 | 24kHz | シングルスピーカー | Mono | 500:00:00 | 要求に応じて |
チームが世界をリードするAI製品を構築できるようにします。
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください