ドイツのデータセット
ドイチャー・デーテンザッツ
AI および音声モデル向けの高品質なドイツのコールセンターおよび IVR データセット
概要
タイトル(言語)
ドイツ語データセット
データセットの種類
コールセンター、一般会話、音楽、台本付きモノローグ
国
Germany
詳細説明
エージェントと顧客間のスクリプトのない合成電話会話が、約 5 ~ 15 分間、H2H、H2M、スクリプト化された独白データ タイプとともに利用できます。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
データセットの詳細
| データセットのタイプ | サンプリング・レート | スピーカー | チャネル | 合計時間 | 講演者の総数 |
|---|---|---|---|---|---|
| センターに電話 | 8kHz | 2スピーカー | デュアル | 64:17:27 | 要求に応じて |
| H2H | 8kHz | 2スピーカー | Mono | 60:00:00 | 96 |
| H2M | 8kHz | 2スピーカー | Mono | 88:00:00 | 659 |
| スクリプト化された独白 | 24kHz | シングルスピーカー | Mono | 1,600:00:00 | 要求に応じて |
注目のクライアント
チームが世界をリードするAI製品を構築できるようにします。
探しているものが見つかりませんか?
新しい既製のデータセットがすべてのデータ タイプにわたって収集されています
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください
概要
Title
ドイツ語 言語データセット
データセットのタイプ
コールセンター
詳細説明
「エージェント」と「顧客」の間のスクリプト化されていない人工的な電話による会話。 音声の長さ (範囲) 5 ~ 15 分。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
データセットの詳細
合計時間
64
サンプリング速度
8kHz
音声チャンネル
ステレオ
レコーディングプラットフォーム
デスクトップ
オーディオ形式
wavファイル
音声文字変換フォーマット
.json
WER(%)
5
データセットの人口統計
国
ドイツ語
言語
ドイツ語
ジェンダー
女性478、男性1440、不明0
スピーカーの数
1,918
年数
18-50
概要
Title
ドイツ語 言語データセット
データセットのタイプ
IVR
詳細説明
ヒューマン トゥ マシン。 TTS プロンプト (「ご用件はありますか」など) の後に人間の自発的な応答が続く IVR タイプのフロー。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
データセットの詳細
合計時間
200
サンプリング速度
8kHz
音声チャンネル
ステレオ
レコーディングプラットフォーム
デスクトップ
オーディオ形式
wavファイル
音声文字変換フォーマット
.json
WER(%)
5
データセットの人口統計
国
ドイツ語
言語
ドイツ語
ジェンダー
女性10115、男性8750、不明0
スピーカーの数
18,865
年数
18-50