AIおよびMLモデルの高品質な医療/医療データのライセンス

既製のヘルスケア/医療データセットを使用して、ヘルスケアAIプロジェクトを迅速に開始できます

医療データカタログ

機械学習のための医療およびヘルスケアデータセット

医師の口述音声データ

医療に関する当社の匿名化されたデータセットには、臨床現場での医師と患者の出会いに基づいて患者の臨床状態とケア計画を医師が説明した 31 の専門分野にわたる音声ファイルが含まれています。

既製の医師の口述オーディオファイル:

  • 医療音声モデルのトレーニングに用いる、257,977の専門分野から集めた31時間分の実際の医師によるディクテーション音声データセット
  • 電話ディクテ​​ーション(54.3%)、デジタルレコーダー(24.9%)、スピーチマイク(5.4%)、スマートフォン(2.7%)、不明(12.7%)などのさまざまなデバイスからキャプチャされたディクテーションオーディオ
  • HIPAAに準拠したセーフハーバーガイドラインに準拠したPII編集済みオーディオおよびトランスクリプト
医師の口述音声データ

転写された医療記録

医療記録の転写とは、医師と患者の会話、医療報告書、医療評価の転写を指します。これは、患者の病歴を将来の診察に備えて記録するのに役立つだけでなく、医師にとっての参考資料としても機能します。患者の現在の状態を評価し、適切な治療を提案するのに役立ちます。

既製の転写された医療記録:

  • ヘルスケアスピーチモデルをトレーニングするための257,977の専門分野からの31時間の実世界の医師の口述の転写
  • 手術報告書、退院要約、診察記録、入院記録、ED記録、臨床記録、放射線報告などのさまざまな作業タイプからの転記された医療記録。
  • HIPAAに準拠したセーフハーバーガイドラインに準拠したPII編集済みオーディオおよびトランスクリプト
転写された医療記録

電子健康記録(EHR)

電子健康記録またはEHRは、患者の病歴、診断、処方箋、治療計画、ワクチン接種または免疫化の日付、アレルギー、放射線画像(CTスキャン、MRI、X線)、および臨床検査などを含む医療記録です。

既製の電子健康記録(EHR):

  • 5.1の専門分野の31万以上のレコードと医師のオーディオファイル
  • 臨床NLPおよびその他のドキュメントAIモデルをトレーニングするための実際のゴールドスタンダードの医療記録
  • MRN(匿名化)、入院日、退院日、滞在日数、性別、患者クラス、支払人、財務クラス、州、退院処分、年齢、DRG、DRGの説明、$償還、AMLOS、GMLOS、リスクなどのメタデータ情報死亡率、病気の重症度、グルーパー、病院の郵便番号など。
  • 米国のさまざまな州および地域の医療記録-北東(46%)、南(9%)、中西部(3%)、西(28%)、その他(14%)
  • 対象となるすべての患者クラスに属する医療記録-入院患者、外来患者(臨床、リハビリ、定期的、外科的デイケア)、緊急事態。
電子健康記録(EHR)
  • 10歳未満(7.9%)、11〜20歳(5.7%)、21〜30歳(10.9%)、31〜40歳(11.7%)、41〜50歳(10.4%)のすべての患者年齢グループに属する医療記録)、51〜60歳(13.8%)、61〜70歳(16.1%)、71〜80歳(13.3%)、81〜90歳(7.8%)、90歳以上(2.4%)
  • 患者の性比は46%(男性)と54%(女性)
  • HIPAAに準拠したセーフハーバーガイドラインに準拠したPII編集済みドキュメント
Shaip お問い合わせ

探しているものが見つかりませんか?

新しい既製の医療データセットがすべてのデータタイプで収集されています 

ヘルスケアトレーニングデータ収集の心配を手放すために今すぐお問い合わせください

  • 登録することで、Shaipに同意します 利用規約 | プライバシーポリシー の三脚と 利用規約 ShaipからB2Bマーケティングコミュニケーションを受け取ることに同意します。

医療データセットには、医師の口述、転写された記録、EHR、AI モデルのトレーニングに使用される医療画像 (CT、MRI、X 線) などのヘルスケア データが含まれます。

はい、データセットは HIPAA や GDPR などの医療規制に準拠しており、安全で倫理的なデータ使用が保証されます。

はい、データセットは、特定の専門分野、人口統計、データ形式、プロジェクト要件に基づいてカスタマイズできます。

データは、ドメイン専門家による注釈付けを含む厳格な品質チェックを受け、正確性と信頼性を確保しています。各データセットは、ゴールドスタンダードの要件を満たすように設計されています。

はい、データセットは、数百万件のレコードや何時間ものオーディオなど、小規模および大規模のプロジェクト要件を満たすように拡張可能です。

はい、データセットはすぐに使用できる形式(JSON、CSV など)で提供されるため、既存の AI および ML ワークフローとシームレスに統合できます。

費用は、データセットの種類、量、カスタマイズ、納期などの要因によって異なります。お見積りをご希望の場合は、「お問い合わせ」フォームにご要望をご記入ください。

配信スケジュールはプロジェクトの複雑さとデータセットのサイズによって異なりますが、プロジェクトの期限に間に合うように構成されます。

高品質の医療データセットは、AI モデルをトレーニングして精度を向上させ、タスクを自動化し、医療における意思決定を強化するために不可欠です。