Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
医療デジタルデータのAI 研究開発等への利活用に係るガイドライン
Search
kento sugimoto
October 31, 2024
Research
160
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
医療デジタルデータのAI 研究開発等への利活用に係るガイドライン
kento sugimoto
October 31, 2024
More Decks by kento sugimoto
See All by kento sugimoto
医療分野におけるLLMの現状と応用可能性について
kento1109
11
4.6k
natural language processing × radiology reports
kento1109
0
150
Diffusion Models
kento1109
0
260
Other Decks in Research
See All in Research
英語教育 “研究” のあり方:学術知とアウトリーチの緊張関係
terasawat
1
990
セマンティック通信勉強会 6Gに向けたデバイス間効率的な通信の技術紹介・課題・今後展望
satai
3
160
Ghost in the 7‑Zip: The Shadow of Residential Proxies Creeping into Your Life
nttcom
0
1.2k
【Zozo Research 技術共有会】三次元領域の現在と展望
mickey_0226
3
380
多様なデータを許容し学習し続ける模倣学習 / Advanced Imitation Learning for VLA
prinlab
0
220
LLM Compute Infrastructure Overview
karakurist
2
1.4k
衛星×エッジAI勉強会 衛星上におけるAI処理制約とそ取組について
satai
4
560
[BlackHatAsia2026] Hidden Telemetry: Uncovering TraceLogging ETW Providers You're Not Using (Yet)
asuna_jp
1
530
YOLO26_ Key Architectural Enhancements and Performance Benchmarking for Real-Time Object Detection
satai
3
810
Scalable dynamic origin-destination demand estimation enhanced by high-resolution satellite imagery data
satai
3
280
データセンター事業者を取り巻く近年の状況とその中での研究開発動向、テストベッドへの貢献の可能性
kikuzo
1
190
2026 東京科学大 情報通信系 研究室紹介 (すずかけ台)
icttitech
0
3.8k
Featured
See All Featured
We Have a Design System, Now What?
morganepeng
55
8.2k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
Building a Scalable Design System with Sketch
lauravandoore
463
34k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
370
Are puppies a ranking factor?
jonoalderson
1
3.6k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
610
The Language of Interfaces
destraynor
162
27k
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
270
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Mobile First: as difficult as doing things right
swwweet
225
10k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.3k
Transcript
医療デジタルデータのAI 研究開発等 への利活用に係るガイドライン
はじめに • 医療AIの開発において、病院に蓄積された膨大な医療情報を貴重なデータ資源として活用し、学術研究 機関等や医療機関等のみならず、製品開発の担い手としての民間企業等を巻き込んだ研究開発を進 め、国民にその利益を還元していくことが期待されている。 • しかしながら、医療情報は、一般的に、個人情報保護法上の個人データに該当する上、同法上の要配慮 個人情報にも該当し、極めて機微な性質を有している。 • 原則として、あらかじめ本人の同意を取得する必要があることとされているが、過去の膨大な数の患者を
対象に個別に同意を取得することは現実的に困難な場合が多いのが実情である 。
医療情報の利活用と法的根拠 • 医療事業者が患者から個人情報を取得する場合、その個人情報を診療目的(医療サービスの提供、医 療保険事務、入退院等の病棟管理など)で利用することは患者にとって明らかと考えられる。 • 一方、診療目的以外で個人情報を利用する場合は、患者にとって明らかな利用目的とはいえない。 • 本ガイドラインでは、医療情報の利活用の具体的な目的として、以下の2通りを考える。 a. 学術研究目的
b. 製品開発目的
医療情報の利活用に関わる事業者 • 医療情報の利活用に関わる事業者を「学術機関等該当性・医療機関等該当性」の軸で整理する 図 1: 医療情報の利活用に関わる事業者
学術研究例外 • 学術研究の目的で医療情報を取扱う場合には、個人の権利利益を不当に侵害するおそれがある場合を 除いて、その扱いの制限が緩和される。これを一般的に「 学術研究例外 」と呼ぶ。 • 学術研究例外の該当性における主体要件とは、 学術研究機関等への該当性 を指す。一方、「学術研究
機関等にあたらない医療機関等」や民間企業等は、その主体要件を満たさない。
共同研究 • 「学術研究機関等にあたらない医療機関等」や民間企業等は、主体要件を満たさないが、「学術研究機 関等が共同研究を行う第三者」であれば、学術研究例外が該当し、本人の同意を得ずに個人データを提 供することができる。 図 3: 学術研究目的の研究を共同で行う場合の医療機関等から民間企業等への医療情報の提供
製品開発目的で医療情報を医療機関等から民間企業等に 提供する際の法的根拠 根拠 検討内容 学術研究例外 学術研究例外における目的要件の観点からは、共同研究の範囲であれば製品開発目的が併存していて も問題ない。ただし、製品開発のみを目的とした活動に対して、学術研究例外を根拠として、医療機関等か ら民間企業等に医療情報を提供することは難しい。 公衆衛生例外 医療
AI ソフトウェア等の医療機器が、「公衆衛生の向上のために特に必要がある場合」に該当する可能 性も直ちには否定されないものと思われる。ただし、この場合、併せて、本人からの同意取得が困難である ことが必要となる。 委託 医療機関等が主体となった利用目的の達成に必要な範囲内で、医療情報の取り扱いの全部又は一部を 委託することに伴い外部の機関へと提供する場合には、提供先は第三者には該当しない。しかし、あくまで も提供元である医療機関等の事業目的のみに使われ、提供先で自己の事業目的に使うことは許されな い。従って、委託を根拠として、製品開発の目的で医療情報を民間企業等に提供することは難しい。 共同利用 医療機関等が、特定の者との間で医療情報を共同利用する場合には、提供先は第三者に該当しない(こ こで、「共同利用」は「共同研究」とは異なる概念)。医療機関等における共同利用の具体的な事例として は、病院と訪問看護ステーションが共同で医療サービスを提供している場合等が挙げられる。しかしなが ら、共同利用は「取得の際に通知・公表している利用目的の範囲内であり、利用目的が本人が通常予期し 得ると客観的に認められるような場合」でなければ認められない。従って、共同利用を根拠として個人デー タである医療情報の提供を実施することが難しい。
仮名加工情報とその共同利用 • 仮名化された個人情報について、一定の安全性を確保しつつ、データとしての有用性を加工前の個人情 報と同等程度に保つことにより、詳細な分析を比較的簡便な加工方法で実施し得るものとして利活用した いというニーズがあった。こうした背景から、氏名等を削除した仮名加工情報が個人情報保護法において 創設された。 • 仮名加工情報にすることで、「 利用目的の変更 」が認められることになり、
あらかじめ通知・公表している 利用目的を超えた利用目的への変更が許容される 。しかし、利用目的を変更した場合には、原則として 変更後の利用目的を「公表」しなければならない。
仮名加工情報とその共同利用 • 特定の者との間で共同して利用される仮名加工情報を当該特定の者に提供する場合であって、次の 1. から5.までの情報を、提供に当たりあらかじめ公表しているときには、当該提供先は、当該仮名加工情報 の提供元の事業者と一体のものとして取扱われることに合理性があると考えられることから、第三者に該 当しないものとされる。 1. 共同利用をする旨 2.
共同して利用される仮名加工情報である個人データの項目 3. 共同して利用する者の範囲 4. 利用する者の利用目的 5. 当該仮名加工情報である個人データの管理について責任を有する者 の氏名又は名称及び住所並びに法人にあっては、その代表者の氏名
仮名加工情報の第三者提供 • 仮名加工情報は、法令に基づく場合を除くほか、第三者提供が禁止される。 • また、仮名加工情報の転々流通を防ぐために、仮名加工情報を作成した元の医療機関等を共同利用の 範囲に含めない形で仮名加工情報を取り扱ってはならないものとする(図 6 参照)。 図 6:
仮名加工情報の転々流通について
仮名加工情報の個人情報該当性 • 提供元である医療機関等:当該医療機関等では、仮名加工情報と元の医療情報を容易に照合すること で、特定の個人を識別することができる。よって、供元である医療機関等にとって、当該仮名加工情報は 「個人情報である仮名加工情報 」となる。 • 提供先である民間企業等:当該民間企業等においては元の医療情報を有していないため、当該仮名加 工情報を他の情報と容易に照合して特定の個人を識別することはできないことが通常である。この条件 を満たす限り、提供先である民間企業等では、当該仮名加工情報は「
個人情報でない仮名加工情報 」と なる。
仮名加工情報の作成手順 • 個人情報取扱事業者は、仮名加工情報を作成するときは、他の情報と照合しない限り特定の個人を識別 することができないようにするために、個人情報保護法に定める以下の基準に従って、個人情報を加工し なければならない。 1. 記述等による単体識別性の消去:個人情報に含まれる特定の個人を識別することができる記述等の全部又は 一部を削除すること(当該全部又は一部の記述等を復元することのできる規則性を有しない方法により他の記述 等に置き換えることを含む) 2.
個人識別符号による単体識別性の消去:個人情報に含まれる個人識別符号の全部を削除すること(当該個人識 別符号を復元することのできる規則性を有しない方法により他の記述等に置き換えることを含む) 3. 財産的被害が生じるおそれがある記述等の削除:個人情報に含まれる不正に利用されることにより財産的被害 が生じるおそれがある記述等を削除すること(当該記述等を復元することのできる規則性を有しない方法により 他の記述等に置き換えることを含む)
単体識別性と容易照合性 • 単体識別性:他の情報と照合することなく、特定の個人を識別することができること • 容易照合性:他の情報と容易に照合することによって特定の個人を識別できること 仮名加工情報において、加工前の情報との容易照合性の観点は考慮されない(特定の個 人を識別することができる状態にあることを否定するものではない)
単体識別性と容易照合性 図 7: 単体識別性と容易照合性の観点を踏まえた仮名加工情報の加工基準の考え方
識別子の加工 • 識別子とは、その記述等のみで特定の個人を識別することができる記述等である(氏名・顔写真・特定の 個人を識別できる映像情報など)。 • 従って、「記述等による単体識別性の消去」として、単体識別性を消去する目的で、削除・置換・マスク処 理などの加工を行う必要がある。
準識別子の加工 • 準識別子とは、その記述等のみでは直ちに特定の個人を識別することができない記述等である(郵便番 号・住所・生年月日・性別・検査日・医療機関等の識別情報等)。 • 従って、単体識別性を失わせるという観点からは、全ての準識別子を一律に削除する必要は必ずしもな い。ただし、組み合わせて保存されている複数の準識別子から特定の個人を識別できる場合がある。そ のような場合には、単体識別性を失わせるために、準識別子についても、他の情報と照合しない限り特 定の個人を識別することができないよう、その全部又は一部を削除することが求められる。
準識別子の加工 • 準識別子の組み合わせによって特定の個人の識別を防ぐための技術的措置として、 削除を除く類型を以 下に挙げる。 • 一般化:上位概念への置換・四捨五入 • トップ(ボトム)コーディング:数値に対して、特に大きい又は小さい数値をまとめる •
ミクロアグリゲーション:グループ化した後、グループの代表的な記述等に置き換える • データ交換(スワップ):個人情報相互に含まれる記述等を(確率的に)入れ替える • ノイズ(誤差)付加:一定の分布に従った乱数的な数値を付加することにより、他の任意の数値へと 置き換える • 疑似データ生成:人工的な合成データを作成し、これを加工対象となる個人情報データベース等 に含ませる
具体的な作成手順(診療テキスト) • 診療テキスト情報とは、具体的にはカルテ記載、薬剤情報、健康診断の結果、保健指導の内容、読影レ ポート、病理レポート等を指す。 • 診療テキスト情報には、医療従事者による自由記載が含まれていることがある。こうした自由記載の内容 は予め構造化されていないことが多く、患者、患者の家族、医療従事者に関する識別子・準識別子等が 含まれている可能性が事前に予見できない。したがって、目視を含む確実な方法により識別子・準識別 子等の有無を確認し、適切な加工を施すことが必要である。診療テキスト情報に含まれることの多い記述 等に対して、想定される加工の例を以下のように示す。
具体的な作成手順(診療テキスト) • 診療テキスト情報に含まれることの多い記述等に対して、想定される加工例を以下のように示す。
具体的な作成手順(生理機能検査情報) • 生理機能検査情報とは、具体的にはバイタルデータ、血液検査データ、生理検査データ(心電図、呼吸機 能、脳波等)等を指す。 • 検査値等が客観的な数値等で構成される場合、特段の加工は不要である。
具体的な作成手順(生理機能検査情報) • テキスト情報(検査目的や診断結果、備考等)が含まれる場合、診療テキスト情報と同様に、原則として 目視により識別子・準識別子等の有無を確認し、適切な加工を施すことが必要である。
医療機器の研究開発サイクルと各種の法的根拠の 位置づけ • 医療機器の研究開発サイクルについて、初期の探索的意味合いが強い段階においては学術研究の要 素を含むことが想定されるが、開発が進むにつれて、「営利事業への転用」や「専ら商用目的」であるとみ なされる可能性が高まり、製品開発目的の要素が大きくなることを一般に想定する。 • これまで整理したとおり、診療で得られた医療情報を、通常の個人データとして、製品開発のみを目的と して取り扱うことを、一般的に適法化できる法的根拠は、本人の同意以外に見出すことが難しい。
医療機器の研究開発サイクルと各種の法的根拠の 位置づけ • そこで、本ガイドラインでは、「 製品開発目的の要素が大きくなる開発の段階から、遅くとも承認申請書類 作成の段階までにおいて、医療機関等と民間企業等との間で仮名加工情報の共同利用を設定する 」こと を推奨する。 図 11:
本ガイドラインの想定する医療機器の研究開発サイクルの例
生命科学・医学系指針との対応 • 医療機関等において診療で得られ、既に保管されている医療情報を「人を対象とする生命科学・医学系 研究」として利活用する場合には、生命科学・医学系指針における「既存の情報」として取扱うこととなる。 • この場合、生命科学・医学系研究指針に示された手続きを行うことで、インフォームド・コンセントを受ける ことを要さず、当該仮名加工情報を利用することができる。
終わりに • 本スライドでは、なるべく、ガイドラインの文言・表現の通りの記載をしておりますが、部分的に分かりやす さのため、オリジナルの文言・表現を使用しております。 • 本スライドでガイドラインの概要を確認いただき、実際に利活用する場合は、 ガイドラインを一読されるこ とをおすすめします。 • 医療デジタルデータの
AI 研究開発等への利活用に係るガイドライン