会話型AIモデルをトレーニングするための高品質の音声/音声/音声データセット
自動音声認識(ASR)モデルをすぐに開始するための、複数の言語の既製の音声/音声/音声データセット
今日見逃していたオーディオデータカタログをプラグインする
お問い合わせ内容 | キーワード | 言語データセット | サンプリング速度 | データセットのタイプ | 合計オーディオ時間 | 総スピーチ時間 | データセットの説明 | 音声チャンネル | レコーディングプラットフォーム | WER(%) | オーディオ形式 | 音声文字変換フォーマット | Use Case | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
アフリカ系アメリカ人 | アフリカ系アメリカ人の言語 | 8kHz | コールセンター | 214 | 211 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
アフリカ系アメリカ人 | アフリカ系アメリカ人の言語 | 16kHz | メディアオーディオ | 159 | 149 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
アフリカーンス語 | アフリカーンス語 | 8kHz | 一般的な会話 | 368 | 404 | 二人の間の台本なしの電話での会話。 約音声再生時間(範囲)-15〜60分、アフリカーンス語はアフリカで話されています | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
アフリカーンス語 | アフリカーンス語 | 16kHz | メディアオーディオ | 658 | 615 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
アラビア語 | アラビア語 | 8kHz | 一般的な会話 | 293 | 297 | 二人の間の台本なしの電話での会話。 約音声再生時間(範囲)-15〜60分、湾岸諸国からのアラビア語 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ボストン | ボストン | 8kHz | コールセンター | 177 | 175 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ボストン | ボストン | 8kHz | 一般的な会話 | 32 | 32 | 二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ボストン | ボストン | 16kHz | メディアオーディオ | 93 | 93 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
中国語英語 | 中国語英語 | 8kHz | コールセンター | 169 | 130 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
中国語英語 | 中国語英語 | 16kHz | メディアオーディオ | 249 | 236 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
デンマーク語 | デンマーク語 | 8kHz | 一般的な会話 | 372 | 395 | 二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
デンマーク語 | デンマーク語 | 16kHz | メディアオーディオ | 664 | 603 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
英語 | 英語 | 16kHz | メディアオーディオ | 10 | 9 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
イングリッシュディープサウス | イングリッシュディープサウス | 8kHz | コールセンター | 151 | 149 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
イングリッシュディープサウス | イングリッシュディープサウス | 8kHz | 一般的な会話 | 56 | 56 | 二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
イングリッシュディープサウス | イングリッシュディープサウス | 16kHz | メディアオーディオ | 266 | 248 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ヘブライ語 | ヘブライ語 | 8kHz | 一般的な会話 | 399 | 397 | 二人の間の台本なしの電話での会話。 約音声再生時間(範囲)-15〜60分、イスラエルのヘブライ語 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ヘブライ語 | ヘブライ語 | 16kHz | メディアオーディオ | 427 | 400 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ヒングリッシュ | ヒングリッシュ | 8kHz | コールセンター | 208 | 185 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ヒングリッシュ | ヒングリッシュ | 16kHz | メディアオーディオ | 216 | 219 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ヒスパニック英語 | ヒスパニック英語 | 8kHz | コールセンター | 212 | 209 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ヒスパニック英語 | ヒスパニック英語 | 16kHz | メディアオーディオ | 155 | 150 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
インド英語 | インド英語 | 16kHz | メディアオーディオ | 137 | 87 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
インドネシア語 | インドネシア語 | 8kHz | 一般的な会話 | 496 | 598 | 二人の間の台本なしの電話での会話。 約音声再生時間(範囲)-15〜60分、インドネシア語 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
インドネシア語 | インドネシア語 | 16kHz | メディアオーディオ | 643 | 610 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
アイリッシュ | アイリッシュ | 8kHz | 一般的な会話 | 192 | 180 | 二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
韓国語 | 韓国語 | 8kHz | コールセンター | 107 | 103 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
韓国語 | 韓国語 | 16kHz | メディアオーディオ | 204 | 197 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
マレー語 | マレー語 | 8kHz | 一般的な会話 | 266 | 302 | 二人の間の台本なしの電話での会話。 約音声再生時間(範囲)-15〜60分、マレーシアのマレー語 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
マレー語 | マレー語 | 16kHz | メディアオーディオ | 344 | 305 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ニュージーランド英語 | ニュージーランド英語 | 8kHz | 一般的な会話 | 148 | 142 | 二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ニュージーランド英語 | ニュージーランド英語 | 16kHz | メディアオーディオ | 400 | 400 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ニューヨーク英語 | ニューヨーク英語 | 8kHz | コールセンター | 103 | 103 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ニューヨーク英語 | ニューヨーク英語 | 8kHz | 一般的な会話 | 107 | 106 | 二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ニューヨーク英語 | ニューヨーク英語 | 16kHz | メディアオーディオ | 140 | 140 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ポーランド語 | ポーランド語 | 16kHz | メディアオーディオ | 269 | 255 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
スコットランドの | スコットランドの | 8kHz | 一般的な会話 | 292 | 267 | 二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
シンガポール英語 | シンガポール英語 | 8kHz | コールセンター | 218 | 194 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
シンガポール英語 | シンガポール英語 | 16kHz | メディアオーディオ | 247 | 240 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
南アフリカ英語 | 南アフリカ英語 | 8kHz | コールセンター | 261 | 204 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
南アフリカ英語 | 南アフリカ英語 | 16kHz | メディアオーディオ | 251 | 245 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
スペイン語 | スペイン語 | 16kHz | メディアオーディオ | 3 | 2 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
スワヒリ語 | スワヒリ語 | 8kHz | コールセンター | 184 | 165 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
スワヒリ語 | スワヒリ語 | 8kHz | コールセンター | 46 | 44 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
スワヒリ語 | スワヒリ語 | 16kHz | メディアオーディオ | 203 | 191 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
スワヒリ語 | スワヒリ語 | 16kHz | メディアオーディオ | 62 | 58 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
スウェーデン語 | スウェーデン語 | 8kHz | コールセンター | 250 | 224 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
スウェーデン語 | スウェーデン語 | 16kHz | メディアオーディオ | 278 | 255 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
テルグ語 | テルグ語 | 8kHz | 一般的な会話 | 553 | 582 | 二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
テルグ語 | テルグ語 | 16kHz | メディアオーディオ | 648 | 599 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
タイ語 | タイ語 | 8kHz | 一般的な会話 | 183 | 201 | 二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、友人間で使用される非公式のレジスタ | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
タイ語 | タイ語 | 16kHz | メディアオーディオ | 173 | 167 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ベトナム語 | ベトナム語 | 8kHz | 一般的な会話 | 295 | 293 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、北部(例、ハノイ)、中部、南部(例、ホーチミン市)。 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ベトナム語 | ベトナム語 | 16kHz | メディアオーディオ | 257 | 248 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ウェールズ語 | ウェールズ語 | 8kHz | 一般的な会話 | 278 | 299 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
インド英語 | インド英語 | 8kHz | コールセンター | 200 | 200 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
テルグ語 | テルグ語 | NA | コールセンター | 30 | 30 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
タミル語 | タミル語 | NA | コールセンター | 60 | 60 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
カンナダ語 | カンナダ語 | NA | コールセンター | 60 | 60 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
マラヤーラム語 | マラヤーラム語 | NA | コールセンター | 60 | 60 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ベンガル語 | ベンガル語 | NA | コールセンター | 60 | 60 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
グジャラート語 | グジャラート語 | NA | コールセンター | 60 | 60 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
マラーティー語 | マラーティー語 | NA | コールセンター | 60 | 60 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
アッサム語 | アッサム語 | NA | コールセンター | 60 | 60 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
オリヤー語 | オリヤー語 | NA | コールセンター | 60 | 60 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
パンジャブ語 | パンジャブ語 | NA | コールセンター | 60 | 60 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
テルグ語 | テルグ語 | NA | 一般的な会話 | 50 | 50 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
タミル語 | タミル語 | NA | 一般的な会話 | 100 | 100 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
カンナダ語 | カンナダ語 | NA | 一般的な会話 | 100 | 100 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
マラヤーラム語 | マラヤーラム語 | NA | 一般的な会話 | 100 | 100 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ベンガル語 | ベンガル語 | NA | 一般的な会話 | 100 | 100 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
グジャラート語 | グジャラート語 | NA | 一般的な会話 | 100 | 100 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
マラーティー語 | マラーティー語 | NA | 一般的な会話 | 100 | 100 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
アッサム語 | アッサム語 | NA | 一般的な会話 | 100 | 100 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
オリヤー語 | オリヤー語 | NA | 一般的な会話 | 100 | 100 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
パンジャブ語 | パンジャブ語 | NA | 一般的な会話 | 100 | 100 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
テルグ語 | テルグ語 | NA | メディアオーディオ | 20 | 20 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
タミル語 | タミル語 | NA | メディアオーディオ | 40 | 40 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
カンナダ語 | カンナダ語 | NA | メディアオーディオ | 40 | 40 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
マラヤーラム語 | マラヤーラム語 | NA | メディアオーディオ | 40 | 40 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ベンガル語 | ベンガル語 | NA | メディアオーディオ | 40 | 40 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
グジャラート語 | グジャラート語 | NA | メディアオーディオ | 40 | 40 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
マラーティー語 | マラーティー語 | NA | メディアオーディオ | 40 | 40 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
アッサム語 | アッサム語 | NA | メディアオーディオ | 40 | 40 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
オリヤー語 | オリヤー語 | NA | メディアオーディオ | 40 | 40 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
パンジャブ語 | パンジャブ語 | NA | メディアオーディオ | 40 | 40 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | NA | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
英語米国 | 英語米国 | 48kHz | スクリプト化された独白 | 5 | 4 | 5〜30秒の範囲に入る傾向がある単一発話の録音 | モノ | ZOOO アプリについて | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
スペイン語スペイン | スペイン語スペイン | 48kHz | スクリプト化された独白 | 10 | 8 | 5〜30秒の範囲に入る傾向がある単一発話の録音 | モノ | ZOOO アプリについて | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
メキシコ人 | メキシコ人 | 48kHz | スクリプト化された独白 | 1,492 | 1,228 | 5〜30秒の範囲に入る傾向がある単一発話の録音 | モノ | ZOOO アプリについて | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
48kHz | スクリプト化された独白 | 1,222 | 1,049 | 5〜30秒の範囲に入る傾向がある単一発話の録音 | モノ | ZOOO アプリについて | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |||
オランダ | オランダ | 48kHz | スクリプト化された独白 | 1,205 | 1,021 | 5〜30秒の範囲に入る傾向がある単一発話の録音 | モノ | ZOOO アプリについて | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ポーランドポーランド | ポーランドポーランド | 48kHz | スクリプト化された独白 | 1,482 | 1,266 | 5〜30秒の範囲に入る傾向がある単一発話の録音 | モノ | ZOOO アプリについて | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
トルコトルコ | トルコトルコ | 48kHz | スクリプト化された独白 | 2,027 | 1,735 | 5〜30秒の範囲に入る傾向がある単一発話の録音 | モノ | ZOOO アプリについて | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
中国語(繁体字) | 中国語(繁体字) | 48kHz | スクリプト化された独白 | 1,028 | 891 | 5〜30秒の範囲に入る傾向がある単一発話の録音 | モノ | ZOOO アプリについて | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
アラビア語 | アラビア語 | 48kHz | スクリプト化された独白 | 1,947 | 1,594 | 5〜30秒の範囲に入る傾向がある単一発話の録音 | モノ | ZOOO アプリについて | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
デンマーク語 | デンマーク語 | 48kHz | スクリプト化された独白 | 2,579 | 2,041 | デンマークのデンマーク語で、5〜30秒の範囲に収まる傾向がある単一発話の録音 | モノ | ZOOO アプリについて | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ヒンディー語 | ヒンディー語 | 8kHz | コールセンター | 122 | 131 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ヒンディー語 | ヒンディー語 | 16kHz | メディアオーディオ | 219 | 202 | インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分 | モノ | デスクトップ | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ヒンディー語 | ヒンディー語 | 48kHz | スクリプト化された独白 | 2,867 | 2,105 | 5〜30秒の範囲に入る傾向がある単一発話の録音 | モノ | ZOOO アプリについて | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
日本語 | 日本語 | 48kHz | スクリプト化された独白 | 2,335 | 2,029 | 5〜30秒の範囲に入る傾向がある単一発話の録音 | モノ | ZOOO アプリについて | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
韓国語 | 韓国語 | 48kHz | スクリプト化された独白 | 1,955 | 1,548 | 5〜30秒の範囲に入る傾向がある単一発話の録音 | モノ | ZOOO アプリについて | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ロシア語 | ロシア語 | 48kHz | スクリプト化された独白 | 2,398 | 2,046 | 5〜30秒の範囲に入る傾向がある単一発話の録音 | モノ | ZOOO アプリについて | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
簡体字中国語 | 簡体字中国語 | 48kHz | スクリプト化された独白 | 2,762 | 2,181 | 5〜30秒の範囲に入る傾向がある単一発話の録音 | モノ | ZOOO アプリについて | 5 | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ | |
ドイツ語 | ドイツ語 | 8kHz | コールセンター | 64 | 0 | 「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、 | デュアル | デスクトップ | wavファイル | .json | ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング | お問い合わせ |
会話型AI開発を加速するためのGroundTruthオーディオおよび音声データ
Shaipは、40k時間以上の音声データセット/音声データセットを使用して、高品質の音声データセットを使用して会話型AIモデルをスケーリングするのに役立ちます。 ゴールドスタンダードの音声データセットは、複数の言語と方言、人口統計、話者の特性、対話の種類、環境、およびシナリオで収集されます。 探しているものが見つからない場合は? – Shaipは、性別、年齢、言語、設定を問わず、あらゆる音声データセットを支援します。
サポートしている言語データセットのいくつか: すべての主要な言語と方言のデータセットがあります。 最も人気のある言語には次のものがあります。
アフリカの音声データセット
アラビア語の音声データセット
カナダの音声データセット
中国語の音声データセット
デンマーク語の音声データセット
英語の音声データセット
ドイツ語の音声データセット
ヘブライ語音声データセット
インドネシア語の音声データセット
アイルランドの音声データセット
日本語の音声データセット
韓国語の音声データセット
メキシコの音声データセット
ポーランド語の音声データセット
ロシア語の音声データセット
スコットランドの音声データセット
スペイン語の音声データセット
スウェーデン語の音声データセット
タイ語の音声データセット
トルコ語の音声データセット
ベトナム語の音声データセット
データセットの説明
コールセンターの会話8khz: スクリプト化されていない合成電話会話:「エージェント」と「顧客」
一般的な会話8khz: 2人の間の台本なしの電話での会話
メディアとポッドキャスト16khz: パブリックドメインのオーディオ/ビデオインタビュー、ポッドキャストなど1〜5人
発話/スクリプトモノローグ16khz: プロンプトに基づく録音
探しているものが見つかりませんか?
新しい既製のオーディオと音声のデータセットがすべてのデータタイプで収集されています
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください