ASR のための合成ヘルスケア会話

総合的なヘルスケア会話を通じてアンビエントテクノロジー開発を可能にする

アンビエントテクノロジー

臨床現場で収集および文字起こしされた 2000 時間以上の音声データ

急速に進化する会話型 AI の分野で、注目に値するアプリケーションの XNUMX つはヘルスケア分野であり、テクノロジーを利用して医療提供者と患者のやり取りを合理化します。 ヘルスケア テクノロジーの大手企業である当社のクライアントは、臨床現場での複数話者の会話をよりよく理解し、文字に起こすために自動音声認識 (ASR) モデルを強化するという要件を Shaip に持ちかけました。 プライバシー規制のため、現実世界の対話を取得するのは困難でした。 したがって、医療提供者と患者の間の合成的かつ現実的なやりとりを作成し、転写するというアイデアが生まれました。

音量

2,000 数時間、またはおよそ 12,000 〜へ 24,000 の個々の合成相互作用 10 分の平均継続時間。

DevOps Tools Engineer試験のObjective

私たちの主な目的は、約 2,000 時間の音声録音を生成し、12,000 ~ 24,000 の細心の注意を払って作成された合成インタラクションを生成し、性別、年齢、アクセント、医療の役割の多様性を具体化することでした。 この包括的で本物のデータセットは、現実世界の臨床対話を模倣するように設計されており、HIPAA などのプライバシー規制を厳格に遵守しながら作成されました。 合成インタラクションは、クライアントの ASR モデルのトレーニングと改良に役立つ豊富なデータセットとして機能し、臨床現場での現実世界の会話を処理する能力を大幅に向上させました。

 

試験

課題

企業コンプライアンス

HIPAA などのプライバシー法の順守を確保しながら、現実的でありながら人工的な医療インタラクションを作成することは、困難な場合があります。

企業コンプライアンス

データの信頼性と多様性

幅広いシナリオ、アクセント、年齢、医療の役割を網羅しながら、現実世界の臨床対話を正確に模倣する合成インタラクションを作成するには、細心の注意を払ったアプローチと深い専門知識が必要です。

データの信頼性と多様性

品質保証

目標とする 95% の単語精度率 (WER) や 90% のタグ精度率 (TER) など、転写における高レベルの精度を達成するには、厳格な品質保証プロセスが必要です。

技術的能力

録音および転写プラットフォームを含む技術インフラストラクチャが大量のデータを処理し、品質を維持できるようにすることは、重要な課題です。

リソースの採​​用とトレーニング

ロールプレイ用に医学的背景を持つ人を採用し、自然な会話の流れを維持しながら現実的なシナリオに忠実に従うようにすることは、非常に困難な場合があります。 さらに、厳格な品質ガイドラインを遵守するように転写担当者をトレーニングするには、多大な努力と専門知識が必要です。

アプローチ/ソリューション

音声の収集と文字起こし

  • シナリオ作成: 高血圧、糖尿病、疼痛管理など、成人の家庭医療で遭遇する一般的な非緊急状態を反映した現実的なシナリオを開発しました。
  • ロールプレイ: 医学的背景を持つ個人を採用し、医療提供者と患者としてロールプレイを行い、提供されたシナリオに従い、現実世界の臨床会話をシミュレートします。
  • 録音: Shaip Work モバイル アプリを使用して音声をキャプチャし、参加者の性別、年齢、アクセント、職業的背景の点で多様な表現を確保しました。

検証と転記

  • 検証スクリプトを実行して、オーディオ ファイルの正確さと品質を確認しました。
  • 文字起こしは Bhasha プラットフォーム上で実行され、提供された特定のガイドラインに従い、正確な日記を付けて逐語的なテキストの文字起こしが保証されました。
  • 話者 ID、年齢、性別、母語、医療トレーニング/経験などの注釈付きメタデータ。これらはクライアントのモデル トレーニングの目的にとって重要です。

品質保証

  • CQA と PMO による包括的な品質チェックにより、95% の単語精度率 (WER) と 90% のタグ精度率 (TER) という文字起こし品質目標が保証されました。

データ配信

  • データを明確かつ組織的な方法で構造化し、詳細なバッチ ノートとカルチャー ディレクトリとともにバッチで配信しました。
  • オーディオ ファイル、文字起こし、メタデータを含むすべてのデータが、クライアントの仕様に従って正確にラベル付けされ、フォーマットされていることを確認します。

フィードバックと反復

クライアントとの強力なフィードバック ループを確立して欠陥を特定し、確実に修正を行い、完全で正確なデータセットを提供します。

主な成果

  • 2000 時間の合成医療インタラクションの収集と転写に成功しました。
  • 驚くべき精度率で迅速かつ正確な文字起こしを行い、ASR モデルを強化するというクライアントの目標に大きく貢献します。
  • 品質と精度に対する細心の注意を払い、大規模で複雑なプロジェクトを処理する Shaip の能力を実証しました。

結果

Shaip が推進した細心の注意を払って実行されたプロジェクトにより、クライアントの ASR モデルの強化に大きく貢献した豊富なデータセットが得られました。 合成インタラクションにより、臨床対話の現実的な表現が作成され、クライアントが医療環境向けに、より堅牢で信頼性の高い音声サービスを実現するのに役立ちます。 Shaip は、構造化され、よく調整されたアプローチを通じて、規定の期間内で複雑なプロジェクトを確実に成功裏に遂行し、ヘルスケア領域における大規模な会話型 AI プロジェクトの管理における専門知識を強化しました。

Shaip との協力により、ヘルスケアにおけるアンビエント テクノロジーと会話型 AI のプロジェクトが大幅に前進しました。 合成医療対話の作成と転写に関する彼らの専門知識は強固な基盤を提供し、規制上の課題を克服する際の合成データの可能性を示しました。 Shaip を使用することで、これらのハードルを乗り越え、直感的なヘルスケア ソリューションのビジョンの実現に一歩近づきました。

ゴールデン 5 つ星

ヘルスケア AI を加速する
100%のアプリケーション開発