腫瘍学 NLP 研究の改善

腫瘍学データの精度: NLP モデルの革新のためのライセンシング、匿名化、およびアノテーション

腫瘍学 NLP

最先端の NLP テクノロジーでがん治療に革命を起こす

ヘルスケア業界の大手企業であるこのクライアントは、大量の腫瘍医療記録を処理するための高度な NLP ソリューションを必要としていました。 腫瘍学研究を洗練させるための極めて重要な取り組みの一環として、詳細なデータ分析と厳格なプライバシー基準のバランスをとる必要性が最も重要です。 このケーススタディでは、HIPAA が提供する規制の枠組みの中で、高忠実度のデータ アノテーション、厳密な匿名化の実践、自然言語処理 (NLP) 技術の適用を通じて、クライアントの研究活動を強化するための当社の貢献について概説します。

音量

データライセンス + データID解除
10 ページ
腫瘍学との関係
10 ページ
非腫瘍領域
10 ページ
否定
10 ページ
腫瘍学ドメイン
10 ページ
NER + 関係マッピング
10 ページ

課題

このプロジェクトでは、HIPAA 規制に従って患者のプライバシーを保護する安全なフレームワークの中で、臨床文書の微妙な理解、医療機関の正確な特定、否定ラベルを正確に適用する能力が必要でした。 この取り組みには、大量の複雑なデータを処理するための技術的な専門知識だけでなく、フィードバックを取り入れてアノテーション プロセスのすべての段階で品質を維持するための戦略的アプローチも必要でした。

試験

サービスの詳細な説明

カテゴリー説明
包括的な臨床データの範囲さまざまなノートの種類、ケア環境、腫瘍学のサブ専門分野にまたがり、多様な臨床シナリオを反映する堅牢なデータセットを保証します。
厳格な匿名化HIPAA のセーフハーバー手法に従ってすべてのラベル付きレコードが匿名化されていることを確認し、データのプライバシーとセキュリティに対するクライアントの信頼を確保します。
注釈のガイドラインHIPAA 標準に沿ってラベル付きレコードを準備するための標準データ注釈ガイドラインの作成と実装。
高度なアノテーション戦略確立されたガイドラインに従って、否定ステータスおよびその他の関連情報を特定することに重点を置いて、10,000 ページの腫瘍学関連記録に対する手動の注釈が実行されました。
厳格な品質保証ガイドラインに定められた品質基準を達成する

ソリューション

私たちのアプローチには、次の主要な戦略が含まれていました。

カスタマイズされた腫瘍学データセットの編集

5万件を超えるEHRの膨大なアーカイブから、ゲノム実体に焦点を当てた腫瘍学データに対するクライアントの特殊な要件に応えることを目的として、慎重に選択されたデータのサブセットが抽出されました。 収集プロセスには、腫瘍マーカー、遺伝子、バリアント、TNM ステージの網羅的なリストの作成、キーワード検索を使用してこのデータに豊富に含まれる文書を特定することが含まれていました。 正規表現を使用して、さまざまな遺伝子変異とがんの段階を特定しました。 このアプローチは、さまざまな文書タイプ、専門分野、医療現場、複数の医師からのデータを含む広範なデータ範囲と組み合わせることで、包括的かつ関連性の高い腫瘍学データセットを確保しました。

腫瘍学データセットの編集

厳格な匿名化

このプロセスは、HIPAA の匿名化のためのセーフハーバー方式に厳密に準拠しており、データのプライバシーとセキュリティに対するクライアントの信頼を保証します。 これには、すべての保護された医療情報 (PHI) を削除し、ラベル付きのプレースホルダーに置き換えることが含まれます。これにより、患者の機密性を保護しながらデータの有用性が維持されます。

匿名化変数

カテゴリー下位範疇
名前 患者名、医師名、看護師名、家族名、医療機関名、クリニック名、老人ホーム名、会社名、大学名
ご年齢 
日付日付パターン、月年パターン、日月パターン、日年パターン、日、月、年、季節
会場国、州、都市、番地、郵便番号、部屋番号、スイート番号、階数
ID社会保障番号、医療記録番号、医療保険受給者番号、口座番号、証明書/ライセンス番号、生体認証 ID、記録 ID、アクセッション番号、車両識別番号、ナンバー プレート番号デバイス ID およびシリアル番号
お問い合わせ電話番号、FAX番号、メールアドレス、Web URL、IPアドレス

例:

25年2106月11日午前00時、90歳のハリー・ペイス氏は股関節手術の予定のためフォレスト総合病院に入院したが、事前に主治医のホセ・マーティン博士の相談を受け、ケンドラ・リース氏も付き添った。医学博士。 滞在中、彼はメアリー・フー(NP)とスーザン・レイ(RN)のケアを受け、ペンシルベニア州のR・チャールズ・メランソンにも相談を受けた。 入院と同じ日に行われた手術は成功し、合併症は報告されなかった。 手術後、ペース氏は回復のため、202階2号室に移送された。 彼の妻、エマ・ペースは終始同席し、必要な最新情報をすべて提供されました。 短期間の滞在中、MRN MR99062619 およびアカウント KV000014764 を含む彼の医療記録は、以前の居住地であるグレースウッド ナーシング ホームの標準プロトコルに従って処理されました。 彼は同日遅くに退院し、さらなる療養のためオークランド外来診療所に運ばれた。 プロセス全体を通じて、すべての手順が文書化され、機密保持基準を遵守して確保されています。

例: 匿名化

On 【日付パターン】、午前11時に、Mr. [患者名]、[年]、に入院しました 【医療機関名】 計画された股関節手術のため、以前主治医の医師から相談を受けていました。 [医師の名前]、 と出席した 【医師名】 医学博士。 滞在中、彼は次のようなケアを受けていました。 [看護師]、 NP、および [看護師]、 RN、付き [医師の名前]、 PAさんからも相談を受けています。 入院と同日に行われた手術は成功し、合併症は報告されなかった。 手術後、Mr. [患者名] 号室に移されました。 [部屋番号]、 フロア番号 [階数]、 回復のために。 彼の妻、[家族の名前] は終始同席しており、必要な最新情報はすべて提供されました。 短期間の滞在中のMRNを含む彼の医療記録 【カルテ番号】 とアカウント [口座番号]、 の標準プロトコルに従って処理されました。 [老人ホーム名]、 彼の前の住居。 彼は同日遅くに退院し、 【クリニック名】 さらなる回復のために。 プロセス全体を通じて、すべての手順が文書化され、機密保持基準を遵守して確保されています。

注釈のガイドラインと高度な注釈技術

Shaip は、すべてのラベル付きレコードが一貫して HIPAA 標準に準拠して準備されることを保証する標準データ注釈ガイドラインの確立と実装に尽力しました。 さらに、さまざまな医療記録の 10,000 ページに、否定ステータスやさまざまな腫瘍学下位専門分野を含むその他の臨床関連エンティティの詳細なラベル付けに焦点を当てて、細心の注意を払って注釈が付けられました。 アノテーションは、腫瘍学とデータプライバシー規制の専門知識を持つ専門アノテーターのチームによって実行されました。

複雑な注釈基準

カテゴリー下位範疇
日付の注釈 (腫瘍学)診断日、病期日、発症日、処置日、治療開始日、治療終了日、放射線照射開始日、放射線照射終了日
病気(腫瘍学)がんの問題、組織学、臨床状態、体の部位、行動、グレード、がんのステージ、TNM ステージ、腫瘍マーカー検査、寸法、コード
治療(腫瘍学)がん治療、薬剤投与量、頻度、がん手術、手術結果、放射線治療法、放射線量
ゲノミクスバリエーションコード、研究された遺伝子、方法、検体
否定陰性、陰性の可能性、不確実、陽性の可能性
臨床NERがんの問題 - 体の部位、組織学 - 体の部位、行動 - 体の部位、がんの手術 - 人間関係、放射線療法 - 体の部位、組織学 - グレード、がんの問題 - 次元

例:

腫瘍学臨床記録ステートメント

腫瘍学の臨床ノートに関する声明

「患者のジェーン・ドウは、03年05月2023日にステージIIIBの非小細胞肺がん(NSCLC)、特に腺がんと診断されました。 がんは肺の右下葉にあります。 TNM 病期分類システムによれば T3N2M0 に分類され、腫瘍サイズは 5 cm x 3 cm です。 腫瘍生検標本の PCR 分析により、EGFR エクソン 19 の欠失が特定されました。 カルボプラチン AUC 5 とペメトレキセド 500 mg/m² による化学療法は 03 年 20 月 2023 日に開始され、3 週間ごとに投与される予定です。 60回に分けて30Gyの線量での体外照射療法(EBRT)が04年01月2023日に開始された。 患者の治療は継続中ですが、最近のMRI検査では脳転移の証拠はありません。 リンパ管浸潤の可能性はまだ判明しておらず、完全な化学療法レジメンに対する患者の耐性は依然として不確実である。

腫瘍学の臨床ノートに関する声明

腫瘍学臨床記録ステートメント

厳格な品質保証

厳格な品質基準を維持しながら、クライアントからのフィードバックの効果的な統合を促進する、柔軟なプロジェクト管理フレームワークを導入しました。 必要な品質ベンチマークを達成するためのガイドラインに沿った、包括的な品質保証プロトコルが施行されました。 このプロトコルでは、継続的なレビューと検証が行われ、注釈付きデータの精度と信頼性が確保されました。 このような細心の注意を払った品質監視は、信頼できる NLP ソリューションを構築する上で非常に重要であり、情報に基づいた臨床上の意思決定と卓越した研究に不可欠です。

結果

10,000 件の高品質で匿名化されたラベル付きレコードの配信に成功し、クライアントの NLP モデル開発に安全で貴重なデータセットを提供しました。 NLP の細心の注意の適用と HIPAA 匿名化基準の遵守により、クライアントの現在お​​よび将来の腫瘍学研究の取り組みを支える高度に洗練されたデータセットが得られ、最終的には腫瘍学患者の転帰とケア提供効率の向上を目指しています。

このプロジェクトの成功は、複雑な医療データを正確に処理できる当社の能力を実証し、患者ケアの成果を向上させ、医療革新のペースを加速するというクライアントの目標に貢献します。

Shaip とのパートナーシップは、腫瘍学領域における NLP 機能の向上に貢献してきました。 詳細な否定やその他の臨床実体が注釈付けされた 10,000 件の医療記録を専門的に処理することで、卓越性とコンプライアンスへの取り組みが実証されました。 さらに、HIPAA などのプライバシー基準に対する彼らの取り組みは、最先端の腫瘍治療と診断の開発という AI の取り組みを推進するための貴重なリソースを私たちに提供してくれました。

ゴールデン 5 つ星

ヘルスケア AI を加速する
100%のアプリケーション開発