医療用固有表現抽出 (NER) は、臨床テキスト内の病気、症状、薬剤、手順などの主要な医学用語を識別して分類するプロセスです。
目的
目的は、構造化されていない記録から構造化された医療情報を抽出し、医療分析、研究、臨床意思決定をサポートすることです。
重要性
- 電子健康記録 (EHR) をより有効に活用できるようになります。
- 医学研究と創薬をサポートします。
- 臨床感度が高いため、高い精度が求められます。
- データ プライバシーと HIPAA/GDPR 標準に従う必要があります。
仕組み
- 医療文書またはEHRデータを収集します。
- 関心のあるエンティティ(病気、治療、薬物)を定義します。
- 注釈付きデータセットで NER モデルをトレーニングします。
- モデルを適用して、新しいレコード内のエンティティを抽出します。
- 結果を臨床分析や意思決定サポートに使用します。
例(実世界)
- MIMIC-III データセット: NER 研究用の注釈付き臨床ノート。
- IBM Watson Health: EHR から医療エンティティを抽出します。
- MetaMap (NIH): テキスト内の生物医学的概念を識別します。
参考文献 / さらに読む
- ISO/TS 22220: 健康情報科学 - データ要素と構造。
- 「臨床における固有表現抽出:レビュー」バイオメディカルインフォマティクスジャーナル。
- MIMIC-III 臨床データベース。
- 医療分野における医療固有表現認識