ヒンディー語データセット

हिंदीडेटासेट

AIおよびASRモデル向けの高品質なヒンディー語コールセンター、一般会話、ポッドキャストデータセット

概要

タイトル(言語)

ヒンディー語データセット

データセットの種類

コールセンター、一般会話、メディア(ポッドキャスト)、台本付きモノローグ

インド

詳細説明

2人による15分から60分までの台本のない電話会話に加え、同じ時間帯の1人から5人までの参加者によるインタビューやポッドキャストなど、ライセンス可能なパブリックドメインの音声・動画ファイルもご利用いただけます。さらに、単一発話の録音は通常5秒から30秒で、台本付きの独白データもご利用いただけます。

Use Case

ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング

データセットの詳細

データセットのタイプ サンプリング・レート スピーカー チャネル 合計時間 講演者の総数
センターに電話 8kHz 2スピーカー デュアル 70:45:51 要求に応じて
センターに電話 8kHz 2スピーカー Mono 20,000:00:00 要求に応じて
センターに電話 16kHz 2スピーカー Mono 29:17:20 261
センターに電話 16kHz 2スピーカー デュアル 400:27:10 1200
一般的な会話 8kHz 2スピーカー デュアル 47:48:40 224
メディアデータ 16kHz 複数のスピーカー Mono 227:57:43 438
スクリプト化された独白 48kHz シングルスピーカー Mono 2,866:00:00 3,988
スクリプト化された独白 24kHz シングルスピーカー Mono 29,000:00:00 要求に応じて

注目のクライアント

チームが世界をリードするAI製品を構築できるようにします。

Amazon
グーグル
Microsoft
シャイプにお問い合わせください

探しているものが見つかりませんか?

新しい既製のデータセットがすべてのデータ タイプにわたって収集されています

オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください

  • このフィールドは、検証目的のためであり、不変のままにする必要があります。
  • 登録することで、Shaipに同意します プライバシーポリ および 利用規約 ShaipからB2Bマーケティングコミュニケーションを受け取ることに同意します。