タイトル(言語)
ヒングリッシュ言語データセット
データセットの種類
コールセンター、メディアデータ
国
India
詳細説明
エージェントと顧客間の台本のない合成電話会話は 5 ~ 15 分間利用可能です。一方、1 ~ 5 人の参加者によるインタビューやポッドキャストなどのライセンス可能なパブリック ドメインの音声ファイルや動画ファイルは、通常 15 ~ 60 分間です。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
| データセットのタイプ | サンプリング・レート | スピーカー | チャネル | 合計時間 | 講演者の総数 |
|---|---|---|---|---|---|
| センターに電話 | 8kHz | 2スピーカー | デュアル | 240:54:06 | 2404 |
| メディアデータ | 16kHz | 多言語話者 | Mono | 144:15:36 | 317 |
チームが世界をリードするAI製品を構築できるようにします。
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください
当サイトでは、お客様の利便性向上のためクッキーを使用しています。当サイトを利用することで、お客様はクッキーの使用に同意したことになります。
以下の Cookie 設定を管理します。
エッセンシャルCookieは、基本的な機能を有効にし、Webサイトが適切に機能するために必要です。
Google タグ マネージャーを使用すると、コードを変更することなく、ウェブサイト上のマーケティング タグの管理が簡単になります。
統計 Cookie は匿名で情報を収集します。この情報は、訪問者が当社の Web サイトをどのように使用しているかを理解するのに役立ちます。
Google アナリティクスは、ウェブサイトのトラフィックを追跡、分析し、情報に基づいたマーケティングの意思決定を行う強力なツールです。
サービスURL: ポリシー.google.com (新しいウィンドウで開きます)
詳細については、 クッキーポリシー の三脚と 利用規約 | プライバシーポリシー.