中国語英語データセット
中英文データ集
AI および音声モデル向けの高品質な中国語英語コールセンターおよびポッドキャスト データセット
概要
イベントタイトル
中国語英語 言語データセット
データセットのタイプ
コールセンター
説明
「エージェント」と「顧客」の間のスクリプト化されていない人工的な電話による会話。 音声の長さ (範囲) 5 ~ 15 分。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
データセットの詳細
合計時間
169
サンプリング速度
8kHz
音声チャンネル
デュアル
レコーディングプラットフォーム
デスクトップ
オーディオ形式
wavファイル
音声文字変換フォーマット
.json
WER(%)
5
データセットの人口統計
国家
中国
言語
中国語英語
性別
女性1790、男性523、不明13
スピーカーの数
2,326
年数
18-50
概要
イベントタイトル
中国語英語 言語データセット
データセットのタイプ
Podcast
説明
インタビュー、ポッドキャストなどのライセンス可能なパブリック ドメインのオーディオ/ビデオ ファイル - 1 ~ 5 人。 約。 音声の長さ (範囲) 15 ~ 60 分。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
データセットの詳細
合計時間
249
サンプリング速度
16kHz
音声チャンネル
Mono
レコーディングプラットフォーム
ウェブソーシング
オーディオ形式
wavファイル
音声文字変換フォーマット
.json
WER(%)
5
データセットの人口統計
国家
中国
言語
中国語英語
性別
女性126、男性346、不明6
スピーカーの数
478
年数
18-50
概要
イベントタイトル
武漢 言語データセット
データセットのタイプ
自然な対話
合計時間
500
サンプリング速度
16kHz
中国語 言語データセット
TTS
300
16kHz
福建語 言語データセット
自然な対話
100
16kHz
上海 言語データセット
自然な対話
500
16kHz
四川省 言語データセット
自然な対話
500
16kHz
英語(中国語) 言語データセット
脚本付き 自発的
2,000
16kHz
注目のクライアント
チームが世界をリードするAI製品を構築できるようにします。

探しているものが見つかりませんか?
新しい既製のデータセットがすべてのデータ タイプにわたって収集されています
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください