マレー語データセット

セットデータメラユ

AIおよび音声モデル向けの高品質なマレー語コールセンター、一般会話、ポッドキャストデータセット

概要

タイトル(言語)

マレー語データセット

データセットの種類

コールセンター、一般会話、メディアデータ(ポッドキャストデータ)

マレーシア、インドネシア、ブルネイ、シンガポール

詳細説明

マレーシアのマレー語による 2 人の人物間の台本のない電話会話が 15 分から 60 分の範囲で利用可能です。また、参加者が 1 人から 5 人までのインタビューやポッドキャストなど、同じく 15 分から 60 分の範囲でライセンス可能なパブリック ドメインの音声ファイルや動画ファイルも利用可能です。

Use Case

ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング

データセットの詳細

データセットのタイプ サンプリング・レート スピーカー チャネル 合計時間 講演者の総数
一般的な会話 8kHz 2スピーカー デュアル 239:49:43 432
一般的な会話 48kHz 2スピーカー Mono 90:19:23 140
メディアデータ 16kHz 多言語話者 Mono 343:57:16 907
センターに電話 8kHz 2スピーカー Mono 2,000:00:00 要求に応じて

注目のクライアント

チームが世界をリードするAI製品を構築できるようにします。

Amazon
グーグル
Microsoft
シャイプにお問い合わせください

探しているものが見つかりませんか?

新しい既製のデータセットがすべてのデータ タイプにわたって収集されています

オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください

  • このフィールドは、検証目的のためであり、不変のままにする必要があります。
  • 登録することで、Shaipに同意します プライバシーポリ の三脚と 利用規約 ShaipからB2Bマーケティングコミュニケーションを受け取ることに同意します。