医療AI向けHIPAA準拠の医師ディクテーション音声データ

プライバシーと HIPAA 規制に準拠した既製の医師のディクテーション音声データを使用して、ヘルスケア AI イノベーションを加速します。

医師の口述音声データ データセット

今日見逃していたデータソースを接続します

よりスマートな AI モデルのための高品質な医療用音声データセット

匿名化されたヘルスケアデータセットは、31の多様な専門分野から医師が丁寧に口述した音声ファイルで構成されています。これらの録音は、病院や臨床現場における医師と患者の実際のやり取りから得られた、患者の臨床状態やケアプランの詳細な説明を捉えています。プライバシー規制に完全に準拠したこのデータセットは、高度なヘルスケアAIモデルの学習に最適です。

性別別の医療用音声データ
専門 患者音声ファイル (再生時間: 時間) 音声ファイルの総数
トータル257,9775,172,766
男性58,8502,444,910
女性113,4061,290,900
不明85,7211,436,956
専門分野別の医療用音声データ
専門 患者音声ファイル (再生時間: 時間) 音声ファイルの総数
トータル257,9775,172,766
事故と緊急事態9359
アレルギーと免疫学115222202
麻酔科67722280
麻酔薬19
前払金1631693
循環器内科675041566721
心胸郭17122
心臓胸部外科110
臨床血液学02
結腸および直腸手術7162
大腸外科医45984
救急医療2204328
歯科医165
皮膚科77123014
栄養士44736
救急医療4911112518
内分泌学2057052
耳鼻咽喉科7010175477
常備薬1767106733
消化器病学145840365
一般的な薬1405757
一般的なやり方411318
一般的な手術203871744
婦人科3269103370
ハンド手術245
血液学2588125
ホスピタリスト5931142529
感染症49314001
内科15410445591
インターベンショナル心臓病学151143035
母体胎児医学511355
新生児学104524760
腎臓病73520334
神経内科226963774
脳神経外科46211990
核医学223
OB GYN3562122303
腫瘍学293882996
眼科131641047
検眼331066
整形外科5665164483
耳鼻科3433100811
病理1664097
小児呼吸器学440
小児科専門35682
小児外科223
小児科8779271
理学療法とリハビリテーション134723523
理学療法士1141713
医師助手。638
足病外科424
足病学47312296
プライマリーケア65120120
精神医学212060381
肺気腫129035290
放射線腫瘍学2396558
放射線学334599641
リウマチ学2938729
SICU125
言語病理学328
外科腫瘍学2175758
胸部外科1073336
移植手術611535
泌尿器科317096934
上部胃腸手術458
血管手術19156
血管/一般9268
創部のケア15211
デバイス別の医療用音声データ
専門 患者音声ファイル (再生時間: 時間) 音声ファイルの総数
トータル257,9775,172,766
iPhone66632,382
デジタルレコーダー1,65922,377
混合型69,8181,408,679
スマートフォン51,5331,306,405
スピーチマイク10,329257,730
電話ディクテ​​ーション120,8672,071,557
不明3,10473,636

テキスト、オーディオ、ビデオ、画像など、あらゆる種類のデータライセンスを扱っています。 データセットは、MLの医療データセットで構成されています:医師の口述データセット、医師の臨床ノート、医療会話データセット、医療転写データセット、医師と患者の会話、医療テキストデータ、医療画像– CTスキャン、MRI、ウルトラサウンド(収集された基本カスタム要件) 。

シャイプにお問い合わせください

探しているものが見つかりませんか?

新しい既製の医療データセットがすべてのデータタイプで収集されています 

ヘルスケアトレーニングデータ収集の心配を手放すために今すぐお問い合わせください

  • 登録することで、Shaipに同意します プライバシーポリ および 利用規約 ShaipからB2Bマーケティングコミュニケーションを受け取ることに同意します。

医師のディクテーション音声データは、診察中や病院訪問中に医師が患者の臨床状態、治療計画、または病歴を説明する音声ファイルで構成されます。

このデータは、音声認識、自然言語処理(NLP)、臨床文書作成の自動化といったAIモデルの学習に不可欠です。医療文書作成ワークフローの文字起こし、分析、改善のためのシステム構築に役立ちます。

このデータセットには、257,977の医療専門分野における医師による実際の口述記録31時間分が含まれています。音声は、電話、デジタルレコーダー、スマートフォン、スピーチマイクなど、さまざまなデバイスを使用して録音されています。

はい、すべての音声ファイルは個人を特定できる情報 (PII) を削除するために匿名化されており、患者の機密性が確保されます。

はい、データセットは HIPAA およびセーフ ハーバー ガイドライン、およびその他のグローバル プライバシー標準に準拠しています。

はい、データセットは、プロジェクト要件に基づいて、特定の専門分野、人口統計、または記録デバイスの種類に合わせてカスタマイズできます。

はい、その通りです。データセットは数百万もの音声ファイルを含む膨大な量で、小規模から大規模までのAI/MLプロジェクトに適しています。

医療用音声データと対応するトランスクリプトは、音声認識および自然言語処理 (NLP) モデルにシームレスに統合できる標準形式で提供されます。

音声データは厳格な品質チェックを受け、ドメイン専門家が注釈を検証して正確性と信頼性を確保します。

費用は、データ量、カスタマイズ、プロジェクトの範囲などの要因によって異なります。最適なお見積りをご希望の場合は、「お問い合わせ」フォームにご要望をご記入ください。

納品スケジュールはプロジェクトの規模と複雑さによって異なりますが、期限を効率的に守れるように構成されています。

これらのデータセットは、臨床文書の自動化、転写の精度の向上、医療提供者の意思決定の改善における AI 機能を強化します。