ボストン英語データセット
概要
説明
「エージェント」と「顧客」の間のスクリプト化されていない人工的な電話による会話。 音声の長さ (範囲) 5 ~ 15 分。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
データセットの詳細
合計時間
177
サンプリング速度
8kHz
音声チャンネル
デュアル
レコーディングプラットフォーム
デスクトップ
オーディオ形式
wavファイル
音声文字変換フォーマット
.json
WER(%)
5
データセットの人口統計
国
ボストン英語
言語設定
ボストン英語
性別
女性:605名、男性:711名、不明:0名
スピーカーの数
2,632
年齢
18-50
概要
説明
15 人の台本のない電話での会話。 約。 音声の長さ (範囲) – 60 ~ XNUMX 分。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
データセットの詳細
合計時間
32
サンプリング速度
8kHz
音声チャンネル
デュアル
レコーディングプラットフォーム
デスクトップ
オーディオ形式
wavファイル
音声文字変換フォーマット
.json
WER(%)
5
データセットの人口統計
国
ボストン英語
言語設定
ボストン英語
性別
女性:53名、男性:83名、不明:0名
スピーカーの数
136
年齢
18-50
概要
説明
インタビュー、ポッドキャストなどのライセンス可能なパブリック ドメインのオーディオ/ビデオ ファイル - 1 ~ 5 人。 約。 音声の長さ (範囲) 15 ~ 60 分。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
データセットの詳細
合計時間
93
サンプリング速度
16kHz
音声チャンネル
Mono
レコーディングプラットフォーム
ウェブソーシング
オーディオ形式
wavファイル
音声文字変換フォーマット
.json
WER(%)
5
データセットの人口統計
国
ボストン英語
言語設定
ボストン英語
性別
女性:43名、男性:181名、不明:2名
スピーカーの数
226
年齢
18-50
注目のクライアント
チームが世界をリードするAI製品を構築できるようにします。
探しているものが見つかりませんか?
新しい既製のデータセットがすべてのデータ タイプにわたって収集されています
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください