タイトル(言語)
ポーランド語データセット
データセットの種類
メディア(ポッドキャスト)、台本付きモノローグ
国
ポーランド
詳細説明
このデータセットには、1〜5 人の参加者によるインタビューやポッドキャスト (15〜60 分) などのライセンス可能なパブリック ドメインの音声または動画ファイルのほか、音声および言語モデルのトレーニングと評価用に 1 人の話者が定義済みのコンテンツを提供するスクリプト付きの独白が含まれています。
Use Case
ASR、仮想アシスタント、チャットボット、会話型AI、音声分析、TTS、言語モデリング
| データセットのタイプ | サンプリング・レート | スピーカー | チャネル | 合計時間 | 講演者の総数 |
|---|---|---|---|---|---|
| メディアデータ | 16kHz | 多言語話者 | Mono | 268:56:51 | 532 |
| スクリプト化された独白 | 48kHz | シングルスピーカー | Mono | 2,348:00:00 | 2,699 |
チームが世界をリードするAI製品を構築できるようにします。
オーディオ/スピーチトレーニングデータ収集の心配を手放すために今すぐお問い合わせください