会話型AIモデルをトレーニングするための高品質の音声/音声/音声データセット 

自動音声認識(ASR)モデルをすぐに開始するための、複数の言語の既製の音声/音声/音声データセット

音声データセット

今日見逃していたオーディオデータカタログをプラグインする

お問い合わせ内容言語データセットサンプリング速度データセットのタイプ合計オーディオ時間総スピーチ時間データセットの説明音声チャンネルレコーディングプラットフォームWER(%)オーディオ形式音声文字変換フォーマットUse CaseCTA
スピーチアフリカ系アメリカ人アフリカ系アメリカ人の言語8kHzコールセンター214211「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチアフリカ系アメリカ人アフリカ系アメリカ人の言語16kHzメディアオーディオ159149インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチアフリカーンス語アフリカーンス語8kHz一般的な会話368404二人の間の台本なしの電話での会話。 約音声再生時間(範囲)-15〜60分、アフリカーンス語はアフリカで話されていますデュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチアフリカーンス語アフリカーンス語16kHzメディアオーディオ658615インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチアラビア語アラビア語8kHz一般的な会話293297二人の間の台本なしの電話での会話。 約音声再生時間(範囲)-15〜60分、湾岸諸国からのアラビア語デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチボストンボストン8kHzコールセンター177175「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチボストンボストン8kHz一般的な会話3232二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチボストンボストン16kHzメディアオーディオ9393インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチ中国語英語中国語英語8kHzコールセンター169130「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチ中国語英語中国語英語16kHzメディアオーディオ249236インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチデンマーク語デンマーク語8kHz一般的な会話372395二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチデンマーク語デンマーク語16kHzメディアオーディオ664603インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチ英語英語16kHzメディアオーディオ109インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチイングリッシュディープサウスイングリッシュディープサウス8kHzコールセンター151149「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチイングリッシュディープサウスイングリッシュディープサウス8kHz一般的な会話5656二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチイングリッシュディープサウスイングリッシュディープサウス16kHzメディアオーディオ266248インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチヘブライ語ヘブライ語8kHz一般的な会話399397二人の間の台本なしの電話での会話。 約音声再生時間(範囲)-15〜60分、イスラエルのヘブライ語デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチヘブライ語ヘブライ語16kHzメディアオーディオ427400インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチヒングリッシュヒングリッシュ8kHzコールセンター208185「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチヒングリッシュヒングリッシュ16kHzメディアオーディオ216219インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチヒスパニック英語ヒスパニック英語8kHzコールセンター212209「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチヒスパニック英語ヒスパニック英語16kHzメディアオーディオ155150インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチインド英語インド英語16kHzメディアオーディオ13787インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチインドネシア語インドネシア語8kHz一般的な会話496598二人の間の台本なしの電話での会話。 約音声再生時間(範囲)-15〜60分、インドネシア語デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチインドネシア語インドネシア語16kHzメディアオーディオ643610インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチアイリッシュアイリッシュ8kHz一般的な会話192180二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチ韓国語韓国語8kHzコールセンター107103「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチ韓国語韓国語16kHzメディアオーディオ204197インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチマレー語マレー語8kHz一般的な会話266302二人の間の台本なしの電話での会話。 約音声再生時間(範囲)-15〜60分、マレーシアのマレー語デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチマレー語マレー語16kHzメディアオーディオ344305インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチニュージーランド英語 ニュージーランド英語 8kHz一般的な会話148142二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチニュージーランド英語 ニュージーランド英語 16kHzメディアオーディオ400400インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチニューヨーク英語ニューヨーク英語8kHzコールセンター103103「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチニューヨーク英語ニューヨーク英語8kHz一般的な会話107106二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチニューヨーク英語ニューヨーク英語16kHzメディアオーディオ140140インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチポーランド語ポーランド語16kHzメディアオーディオ269255インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチスコットランドのスコットランドの8kHz一般的な会話292267二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチシンガポール英語シンガポール英語8kHzコールセンター218194「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチシンガポール英語シンガポール英語16kHzメディアオーディオ247240インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチ南アフリカ英語南アフリカ英語8kHzコールセンター261204「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチ南アフリカ英語南アフリカ英語16kHzメディアオーディオ251245インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチスペイン語スペイン語16kHzメディアオーディオ32インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチスワヒリ語スワヒリ語8kHzコールセンター184165「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチスワヒリ語スワヒリ語8kHzコールセンター4644「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチスワヒリ語スワヒリ語16kHzメディアオーディオ203191インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチスワヒリ語スワヒリ語16kHzメディアオーディオ6258インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチスウェーデン語スウェーデン語8kHzコールセンター250224「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチスウェーデン語スウェーデン語16kHzメディアオーディオ278255インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチテルグ語テルグ語8kHz一般的な会話553582二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、 デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチテルグ語テルグ語16kHzメディアオーディオ648599インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチタイ語タイ語8kHz一般的な会話183201二人の間の台本なしの電話での会話。 約オーディオ持続時間(範囲)-15〜60分、友人間で使用される非公式のレジスタデュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチタイ語タイ語16kHzメディアオーディオ173167インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチベトナム語ベトナム語8kHz一般的な会話295293「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、北部(例、ハノイ)、中部、南部(例、ホーチミン市)。デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチベトナム語ベトナム語16kHzメディアオーディオ257248インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチウェールズ語ウェールズ語8kHz一般的な会話278299「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチインド英語インド英語8kHzコールセンター200200「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチテルグ語 テルグ語 NAコールセンター3030「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチタミル語 タミル語 NAコールセンター6060「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチカンナダ語 カンナダ語 NAコールセンター6060「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチマラヤーラム語 マラヤーラム語 NAコールセンター6060「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチベンガル語 ベンガル語 NAコールセンター6060「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチグジャラート語 グジャラート語 NAコールセンター6060「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチマラーティー語 マラーティー語 NAコールセンター6060「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチアッサム語 アッサム語 NAコールセンター6060「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチオリヤー語 オリヤー語 NAコールセンター6060「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチパンジャブ語 パンジャブ語 NAコールセンター6060「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチテルグ語 テルグ語 NA一般的な会話5050「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチタミル語 タミル語 NA一般的な会話100100「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチカンナダ語 カンナダ語 NA一般的な会話100100「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチマラヤーラム語 マラヤーラム語 NA一般的な会話100100「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチベンガル語 ベンガル語 NA一般的な会話100100「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチグジャラート語 グジャラート語 NA一般的な会話100100「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチマラーティー語 マラーティー語 NA一般的な会話100100「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチアッサム語 アッサム語 NA一般的な会話100100「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチオリヤー語 オリヤー語 NA一般的な会話100100「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチパンジャブ語 パンジャブ語 NA一般的な会話100100「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチテルグ語 テルグ語 NAメディアオーディオ2020インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチタミル語 タミル語 NAメディアオーディオ4040インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチカンナダ語 カンナダ語 NAメディアオーディオ4040インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチマラヤーラム語 マラヤーラム語 NAメディアオーディオ4040インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチベンガル語 ベンガル語 NAメディアオーディオ4040インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチグジャラート語 グジャラート語 NAメディアオーディオ4040インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチマラーティー語 マラーティー語 NAメディアオーディオ4040インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチアッサム語 アッサム語 NAメディアオーディオ4040インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチオリヤー語 オリヤー語 NAメディアオーディオ4040インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチパンジャブ語パンジャブ語NAメディアオーディオ4040インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分NAデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチ英語米国英語米国48kHzスクリプト化された独白545〜30秒の範囲に入る傾向がある単一発話の録音モノZOOO アプリについて5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチスペイン語スペインスペイン語スペイン48kHzスクリプト化された独白1085〜30秒の範囲に入る傾向がある単一発話の録音モノZOOO アプリについて5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチメキシコ人メキシコ人48kHzスクリプト化された独白1,4921,2285〜30秒の範囲に入る傾向がある単一発話の録音モノZOOO アプリについて5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチ  48kHzスクリプト化された独白1,2221,0495〜30秒の範囲に入る傾向がある単一発話の録音モノZOOO アプリについて5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチオランダオランダ48kHzスクリプト化された独白1,2051,0215〜30秒の範囲に入る傾向がある単一発話の録音モノZOOO アプリについて5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチポーランドポーランドポーランドポーランド48kHzスクリプト化された独白1,4821,2665〜30秒の範囲に入る傾向がある単一発話の録音モノZOOO アプリについて5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチトルコトルコトルコトルコ48kHzスクリプト化された独白2,0271,7355〜30秒の範囲に入る傾向がある単一発話の録音モノZOOO アプリについて5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチ中国語(繁体字)中国語(繁体字)48kHzスクリプト化された独白1,0288915〜30秒の範囲に入る傾向がある単一発話の録音モノZOOO アプリについて5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチアラビア語アラビア語48kHzスクリプト化された独白1,9471,5945〜30秒の範囲に入る傾向がある単一発話の録音モノZOOO アプリについて5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチデンマーク語デンマーク語48kHzスクリプト化された独白2,5792,041デンマークのデンマーク語で、5〜30秒の範囲に収まる傾向がある単一発話の録音モノZOOO アプリについて5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチヒンディー語ヒンディー語8kHzコールセンター122131「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチヒンディー語ヒンディー語16kHzメディアオーディオ219202インタビュー、ポッドキャストなどのライセンス可能なパブリックドメインのオーディオ/ビデオファイル-1〜5人。 約音声再生時間(範囲)15〜60分モノデスクトップ5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチヒンディー語ヒンディー語48kHzスクリプト化された独白2,8672,1055〜30秒の範囲に入る傾向がある単一発話の録音モノZOOO アプリについて5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチ日本語日本語48kHzスクリプト化された独白2,3352,0295〜30秒の範囲に入る傾向がある単一発話の録音モノZOOO アプリについて5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチ韓国語韓国語48kHzスクリプト化された独白1,9551,5485〜30秒の範囲に入る傾向がある単一発話の録音モノZOOO アプリについて5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチロシア語ロシア語48kHzスクリプト化された独白2,3982,0465〜30秒の範囲に入る傾向がある単一発話の録音モノZOOO アプリについて5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチ簡体字中国語簡体字中国語48kHzスクリプト化された独白2,7622,1815〜30秒の範囲に入る傾向がある単一発話の録音モノZOOO アプリについて5wavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
スピーチドイツ語ドイツ語8kHzコールセンター640「エージェント」と「顧客」の間の台本なしの合成電話会話、約。 音声再生時間(範囲)5〜15分、デュアルデスクトップwavファイル.jsonASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング

会話型AI開発を加速するためのGroundTruthオーディオおよび音声データ

Shaipは、40k時間以上の音声データセット/音声データセットを使用して、高品質の音声データセットを使用して会話型AIモデルをスケーリングするのに役立ちます。 ゴールドスタンダードの音声データセットは、複数の言語と方言、人口統計、話者の特性、対話の種類、環境、およびシナリオで収集されます。 探しているものが見つからない場合は? – Shaipは、性別、年齢、言語、設定を問わず、あらゆる音声データセットを支援します。

サポートしている言語データセットのいくつか: すべての主要な言語と方言のデータセットがあります。 最も人気のある言語には次のものがあります。

アフリカの音声データセット

アラビア語の音声データセット

カナダの音声データセット

中国語の音声データセット

デンマーク語の音声データセット

英語の音声データセット

ドイツ語の音声データセット

ヘブライ語音声データセット

インドネシア語の音声データセット

アイルランドの音声データセット

日本語の音声データセット

韓国語の音声データセット

メキシコの音声データセット

ポーランド語の音声データセット

ロシア語の音声データセット

スコットランドの音声データセット

スペイン語の音声データセット

スウェーデン語の音声データセット

タイ語の音声データセット

トルコ語の音声データセット

ベトナム語の音声データセット

データセットの説明

コールセンターの会話8khz: スクリプト化されていない合成電話会話:「エージェント」と「顧客」

一般的な会話8khz: 2人の間の台本なしの電話での会話

メディアとポッドキャスト16khz: パブリックドメインのオーディオ/ビデオインタビュー、ポッドキャストなど1〜5人

発話/スクリプトモノローグ16khz: プロンプトに基づく録音 

Shaipお問い合わせ

探しているものが見つかりませんか?

新しい既製のオーディオと音声のデータセットがすべてのデータタイプで収集されています 

オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください

  • 登録することで、Shaipに同意します プライバシーポリシー 及び 利用規約 ShaipからB2Bマーケティングコミュニケーションを受け取ることに同意します。