Upgrade to Pro — share decks privately, control downloads, hide ads and more …

医療支援AI開発における臨床と情報学の連携を円滑に進めるために

Avatar for Masahiro Oda Masahiro Oda
November 12, 2024

 医療支援AI開発における臨床と情報学の連携を円滑に進めるために

Avatar for Masahiro Oda

Masahiro Oda

November 12, 2024
Tweet

More Decks by Masahiro Oda

Other Decks in Research

Transcript

  1. タスク選定(1/2) • どのようなAIを開発するか選定 – 臨床ニーズとAI技術の実現可能性のバランスを考慮 – 最初から本格的なタスク解決に取り組むと,結果が得られるまで時間がかかり 臨床側と情報側双方にフラストレーション 4 臨床

    情報 • スモールスタート – 最初はシンプルなタスク設定でAI試作 – 期間は数か月~半年で実施 – 試作結果から次のタスク選定 • 利点 – 臨床側と情報側が互いの理解を深められる – チームに最適なタスク設定が可能 – 状況に応じたチーム拡大が容易
  2. 医療支援AI開発 6 外部資金 タスク選定 データ整備 AI開発 評価 知財確保 論文化 事業化など

    タスク選定 データ整備 AI開発 評価 スモールスタート(数か月~半年間) 本格的研究(2,3年間)
  3. 医療支援AI開発 7 外部資金 タスク選定 データ整備 AI開発 評価 知財確保 論文化 事業化など

    タスク選定 データ整備 AI開発 評価 スモールスタート(数か月~半年間) 本格的研究(2,3年間)
  4. データ整備(1/3) • AI構築に必要なデータ収集とアノテーション付与 – データ整備の必要性について臨床側と情報側の意識合わせが必要 – データを何件集めないといけないのか? – アノテーションの負担を軽減できないか? 8

    学習に用いる 症例数 期待されるAIの性能 ~500例 正解率50~70% 5,000例程度 正解率80~90%, 非専門医を上回る場合あり 50,000例程度 正解率90%以上, 専門医に迫る結果 100,000例~ 基盤モデル開発などに発展 症例数と期待されるAIの性能 (大まかな目安) 臨床 情報 • 収集するデータ数の検討 – 目標とするAI性能から収集データ数見積り – 類似研究の論文を参考にする 画像数では なく症例数
  5. データ整備(2/3) • Segment Anything Model (SAM / SAM 2)[2,3] –

    様々な画像からセグメンテーションできる汎用的モデル(基盤モデル) – 学習なしで医用画像にも適用可能 – アノテーション作成の補助に利用可能 9 • アノテーションの負担軽減 – より簡単なアノテーションの種類を選択 – AIによるアノテーション補助を活用 Movies from https://segment-anything.com/ [2] Kirillov A., et al., Segment Anything, arXiv:2304.02643, 2023 [3] Ravi N., et al., SAM 2: Segment Anything in Images and Videos, https://ai.meta.com/research/publications/sam-2-segment-anything-in-images-and-videos/, 2024 臨床 情報
  6. データ整備(3/3) • Segment Anything Model (SAM / SAM 2) [2,3]

    – 領域アノテーション作成の補助に利用可能 • 全自動で 領域切り出し • 矩形領域を指定し 領域切り出し 10 [2] Kirillov A., et al., Segment Anything, arXiv:2304.02643, 2023 [3] Ravi N., et al., SAM 2: Segment Anything in Images and Videos, https://ai.meta.com/research/publications/sam-2-segment-anything-in-images-and-videos/, 2024 臨床 情報 ・術具は良い結果 ・臓器や組織は 部分的に出せる ・ガーゼが2領域に 分割されてしまった ・ガーゼとIMAの位置 を矩形で指定するこ とで高精度に切り出 し可能
  7. 医療支援AI開発 11 外部資金 タスク選定 データ整備 AI開発 評価 知財確保 論文化 事業化など

    タスク選定 データ整備 AI開発 評価 スモールスタート(数か月~半年間) 本格的研究(2,3年間)
  8. AI開発(1/2) • データドリブンなAI開発 – AI研究はライバルが多く,開発が遅れると他グループに追い越される – アノテーション付きデータが手に入りにくい 12 臨床 情報

    画像処理手法の分類 深層学習ベースの主要な手法 便利なライブラリ 画像分類 CNN系(ResNet, EfficientNet,…),ViT系 tf.keras.applications, torchvision.models 物体検出 R-CNN系,YOLO系(v3,…,11) MMDetection セグメンテーション FCN系(U-Net, nnU-Net,…), FCN+ViT系(UNETR, Swin UNETR,…) MONAI 画像ドメイン変換 GAN系(CycleGAN, StyleGAN,…) • AI開発の期間短縮の工夫 – 基本的なAI手法のコードを手元に整備し,すぐ使用可能にしておく
  9. AI開発(2/2) 13 • アノテーション無しデータもAI学習に利用可能にする手法の利用 – Semi-/Un-/Self-supervised learningの利用 – セグメンテーションなどで多くの手法が登場 [4]

    Qin An, et al., HTSeg: Hybrid Two-stage Segmentation Framework for Intestine Segmentation from CT Volumes, MICCAI CLIP Workshop, 2024 [5] Ruiyun Zhu, et al., Semi-supervised Tubular Structure Segmentation with Cross Geometry and Hausdorff Distance Consistency, MICCAI 2024, LNCS 15008, 612-622, 2024
  10. 共同研究実施において役立つこと • 専門知識の共有と理解 – 医学:解剖,疾患,診断と治療の過程 – 情報:AIの性質と限界,学習と推定,評価方法,データのバイアス • 定期的なミーティング実施 –

    月1回ほど実施し進捗と課題の共有 • データ整備で気を付けること – データのファイル名やフォルダ名に,日本語やスペースの使用を避ける – ファイル名,アノテーションの命名規則統一 14 臨床 情報
  11. むすび • 医療支援AI開発の経験に基づく臨床-情報の連携の知見を紹介 • タスク選定 – スモールスタートな研究実施を推奨 • データ整備 –

    収集するデータ数決定の考え方 – アノテーション作成の負担軽減 • AI開発 – 開発期間短縮の工夫 – アノテーションが無いデータも学習に利用可能に 15