マラヤーラム語データセット

മലയാളം ഡാറ്റാസെറ്റ്

AIおよび音声モデル向けの高品質なマラヤーラム語の一般会話およびポッドキャストデータセット

概要

タイトル(言語)

マラヤーラム語データセット

データセットの種類

一般会話、メディア(ポッドキャスト)データ

インド

詳細説明

このデータセットには、エージェントと顧客間の台本のない合成電話会話 (5〜15 分) と、1〜5 人の参加者によるインタビューやポッドキャスト (15〜60 分) などのライセンス可能なパブリック ドメインの音声または動画ファイルが含まれています。

Use Case

ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング

データセットの詳細

データセットのタイプ サンプリング・レート スピーカー チャネル 合計時間 講演者の総数
一般的な会話 8kHz 2スピーカー デュアル 70:46:30 576
一般的な会話 8kHz 2スピーカー デュアル 149:39:33 296
メディアデータ 16kHz 複数のスピーカー Mono 12:39:24 81

注目のクライアント

チームが世界をリードするAI製品を構築できるようにします。

Amazon
グーグル
Microsoft
シャイプにお問い合わせください

探しているものが見つかりませんか?

新しい既製のデータセットがすべてのデータ タイプにわたって収集されています

オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください

  • このフィールドは、検証目的のためであり、不変のままにする必要があります。
  • 登録することで、Shaipに同意します プライバシーポリ および 利用規約 ShaipからB2Bマーケティングコミュニケーションを受け取ることに同意します。