ポーランドのデータセット

ポーランドのデータセット

AIおよび音声モデル向けの高品質なポーランド語メディアデータとスクリプト化されたモノローグ

概要

タイトル(言語)

ポーランド語データセット

データセットの種類

メディア(ポッドキャスト)、台本付きモノローグ

ポーランド

詳細説明

このデータセットには、1〜5 人の参加者によるインタビューやポッドキャスト (15〜60 分) などのライセンス可能なパブリック ドメインの音声または動画ファイルのほか、音声および言語モデルのトレーニングと評価用に 1 人の話者が定義済みのコンテンツを提供するスクリプト付きの独白が含まれています。

Use Case

ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング

データセットの詳細

データセットのタイプ サンプリング・レート スピーカー チャネル 合計時間 講演者の総数
メディアデータ 16kHz 多言語話者 Mono 268:56:51 532
スクリプト化された独白 48kHz シングルスピーカー Mono 2,348:00:00 2,699

注目のクライアント

チームが世界をリードするAI製品を構築できるようにします。

Amazon
グーグル
Microsoft
シャイプにお問い合わせください

探しているものが見つかりませんか?

新しい既製のデータセットがすべてのデータ タイプにわたって収集されています

オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください

  • このフィールドは、検証目的のためであり、不変のままにする必要があります。
  • 登録することで、Shaipに同意します プライバシーポリ の三脚と 利用規約 ShaipからB2Bマーケティングコミュニケーションを受け取ることに同意します。