インドネシアのデータセット
クンプランデータインドネシア
AI および音声モデル向けの高品質なインドネシア語の一般会話とポッドキャストのデータセット
一般会話データ
ポッドキャストデータ
一般会話データ
概要
イベントタイトル
インドネシア語 言語データセット
データセットのタイプ
一般的な会話
説明
15 人の台本のない電話での会話。 約。 音声の長さ (範囲) – 60 ~ XNUMX 分、インドネシア語。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
データセットの詳細
合計時間
496
サンプリング速度
8kHz
音声チャンネル
デュアル
レコーディングプラットフォーム
デスクトップ
オーディオ形式
wavファイル
音声文字変換フォーマット
.json
WER(%)
5
データセットの人口統計
国家
インドネシア
言語
インドネシア語
性別
女性524、男性454、不明2
スピーカーの数
980
年数
18-50
ポッドキャストデータ
概要
イベントタイトル
インドネシア語 言語データセット
データセットのタイプ
Podcast
説明
インタビュー、ポッドキャストなどのライセンス可能なパブリック ドメインのオーディオ/ビデオ ファイル - 1 ~ 5 人。 約。 音声の長さ (範囲) 15 ~ 60 分。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
データセットの詳細
合計時間
643
サンプリング速度
16kHz
音声チャンネル
Mono
レコーディングプラットフォーム
ウェブソーシング
オーディオ形式
wavファイル
音声文字変換フォーマット
.json
WER(%)
5
データセットの人口統計
国家
インドネシア
言語
インドネシア語
性別
女性746、男性1507、不明129
スピーカーの数
2,382
年数
18-50
注目のクライアント
チームが世界をリードするAI製品を構築できるようにします。

探しているものが見つかりませんか?
新しい既製のデータセットがすべてのデータ タイプにわたって収集されています
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください