患者と医師の合成会話による臨床環境知能の強化

医療提供者と患者のエンパワーメント: 臨床環境設定における患者と医師の合成会話による ML トレーニングの強化。

合成データの生成

プロジェクト概観

変化の激しい医療業界では、質の高い医療を提供するためには、医療従事者と患者の間で効果的なコミュニケーションをとることが最も重要です。しかし、患者と医療従事者との従来のやり取り方法では、医療会話のニュアンスを捉えることが困難になることがよくあります。

医療トレーニングを推進する取り組みの一環として、米国の開業医と患者の間で合成会話を作成するという斬新なアプローチが採用されました。現実世界の会話をシミュレートすることで、医療提供者は患者教育を改善し、コミュニケーションを強化し、ケアの提供を効率化できます。このプロジェクトの目的は、臨床 AI モデル トレーニングの目的で、自発性と現実的なシナリオに重点を置き、ロールプレイされたやり取りの音声を収集して書き起こすことでした。

主要統計

合成時間の
収集したデータ

2,000可能時間

の番号
医師

850+

Use Case

合成オーディオ生成と
転写

課題

医療会話の複雑さを捉える

合成会話は現実的である必要があり、医療用語、患者の症状、医療提供者の評価など、現実世界の医療交流の複雑さを正確に反映する必要があります。

多様性と代表性の確保

このプロジェクトの目的は、米国の人口の多様性を反映して、さまざまなアクセント、民族、年齢層を代表する合成会話の多様なプールを作成することでした。

データのプライバシーとセキュリティの維持

参加者のプライバシーを保護するために厳格な対策が実施され、データ収集および転写プロセス中に個人情報が共有されたり漏洩したりすることがないようにしました。

品質管理

機械生成シナリオ内の無意味な詳細や欠落している詳細を処理しながら、インタラクションの教育的価値を維持します。

参加者の準備

参加者は、対話中に直接読むことなく、提供されたシナリオに慣れる必要がありました。

周囲のノイズのバランスをとる

主な課題は、周囲の騒音レベルを管理して、主な会話を不明瞭にすることなく背景音がリアリティを高めるようにすることであり、正確なオーディオバランスが必要でした。

一貫したオーディオ品質

録音設定によって音響特性が異なるため、すべてのセッションで一貫したオーディオ品質を維持することが困難でした。

解決策

これらの課題を克服するために、プロジェクトでは次の戦略を採用しました。

  • 人工的な患者と医師の会話は、さまざまな医療分野を専門とする実際の医師が採用された臨床環境設定で録音されました。これらの専門家は、高血圧、糖尿病、疼痛管理などの一般的な医療シナリオを反映した自然な対話を引き出すように設計された会話の開発に貢献しました。これは、実際の人間の会話の流れとニュアンスに非常に似ています。
  • 米国の人口と医療専門家の多様性を反映して多様な参加者を集め、幅広いアクセント、民族、年齢層を網羅した多様な講演者を確保しました。そのため、さまざまな医療専門分野で活躍する実際の医師が米国のさまざまな地域から募集されました。
  • Shaip は、匿名性を維持しながら講演者の参加を追跡するための一意の識別子システムを備えた厳格なデータ プライバシーおよびセキュリティ プロトコルを実装しました。
  • 参加者に、意味不明な機械生成コンテンツの取り扱い方に関するガイドラインを提供しました。
  • 活動的な成人の家庭医療クリニックを象徴する、微妙な環境ノイズのレイヤー(環境ノイズの包含)が統合されました。録音の100%に、ファンの音、機械のハム音、医療機器のビープ音、ミュートされた音声など、クリニックや病院の周囲のノイズ要素が含まれていました。
    背景の会話。
  • 各録音場所の実際の診療所シミュレーションは、標準的な 8×8 フィートの家庭医学診察室 (200 平方フィートを超えない) の寸法と音響を、同様の硬質床で再現するように細心の注意を払って配置されました。部屋には、椅子、テーブル、キャビネット、診察台などの基本的なアイテムが備え付けられ、典型的な臨床環境が再現されました。

プロジェクトの概要

  • 範囲: 合成ヘルスケアインタラクションの音声収集と文字起こし。
  • 期間: 各インタラクションは 5 分以上、平均 10 分を目指しました。
  • ボリューム: 2,000 時間の合成医療提供者と患者の会話が生成されました。
  • 相互作用: 平均持続時間が 12,000 分間の 24,000 ~ 10 の個別の合成インタラクション。
  • 地理: 米国在住の参加者のみ。
  • 多様性の目標:
    •  性別: 男性400人、女性400人、ノンバイナリーまたは非公開50人。
    • 年齢: 20歳から60歳以上の年齢層にわたって均等に分布しています。
    • 人種: 参加者の55%は白人アメリカ人、8%はアフリカ系アメリカ人、8%はヒスパニック系、20%はアジア系、9%はその他でした。
  • 検出技術: 録画にはiPhoneおよびAndroidデバイスを使用します。
  • 医療専門家の参加: 医師、医師助手、看護師、看護師実践者。

アウトカム

医療従事者と患者との合成会話は、医療の提供方法に革命を起こす可能性があります。AI を活用することで、コミュニケーションを改善し、患者教育を強化し、ケアの提供を効率化し、最終的には患者の転帰を改善することができます。

  • 高品質な合成会話: このプロジェクトでは、正確性、多様性、プライバシーに関するクライアントの要件を満たしながら、2,000 時間の高品質な医療従事者と患者の合成会話を生成することに成功しました。
  • バランスのとれた表現: 参加者の性別、年齢、民族的背景がバランスよく混在しており、トレーニング教材の信頼性と包括性に貢献しています。
  • 包括的なデータベース: さまざまなトレーニングや医療教育の目的に使用できる合成会話のリポジトリを確立しました。
  • 強化されたコミュニケーション: 合成会話は医療提供者や研究者に貴重なリソースを提供し、患者ケアやコミュニケーション戦略の改善を可能にしました。
  • 合理化されたプロセス: AI によって生成された会話により、文書作成プロセスが合理化され、管理上の負担が軽減され、医療提供者は患者のケアにさらに集中できるようになりました。
  • 強化されたリアリズム: 制御されながらも本物に近い環境により、トレーニング データの現実感が大幅に向上し、医療専門家により没入感のある学習体験を提供します。
  • サウンドの多様性: 録音された背景音の多様性により、トレーニングの複雑さがさらに増し、複数の聴覚刺激が存在する実際の臨床環境に研修生が備えられるようになりました。

Shaip が医師と患者の会話にリアルな周囲の雑音を取り入れたことで、トレーニング データが大幅に向上しました。これらの高品質の録音で環境の詳細に注意を払うことで、学習体験が充実するだけでなく、医療従事者が患者ケア環境の動的な性質にうまく対応できるようになりました。その結果、患者とのやり取り、医療従事者の効率、文書化プロセスの正確さが著しく向上しました。
Shaip のデータ プライバシーとセキュリティへの取り組みは、同社のサービスに対する当社の信頼をさらに強固なものにしています。当社は、この実りあるコラボレーションを維持し、拡大できることを嬉しく思っています。

ゴールデン 5 つ星