Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
眼科AIコンテスト2024_特別賞_6位Solution
Search
Akifumi Matsumoto
December 01, 2024
Science
0
370
眼科AIコンテスト2024_特別賞_6位Solution
第5回眼科AI学会総会で実施された眼科AIコンテスト2024での特別賞受賞講演資料です。今後参加される方々の参考になれば幸いです。
Akifumi Matsumoto
December 01, 2024
Tweet
Share
Other Decks in Science
See All in Science
05_山中真也_室蘭工業大学大学院工学研究科教授_だてプロの挑戦.pdf
sip3ristex
0
380
Masseyのレーティングを用いたフォーミュラレースドライバーの実績評価手法の開発 / Development of a Performance Evaluation Method for Formula Race Drivers Using Massey Ratings
konakalab
0
130
mathematics of indirect reciprocity
yohm
1
120
01_篠原弘道_SIPガバニングボード座長_ポスコロSIPへの期待.pdf
sip3ristex
0
410
白金鉱業Meetup Vol.15 DMLによる条件付処置効果の推定_sotaroIZUMI_20240919
brainpadpr
2
790
Online Feedback Optimization
floriandoerfler
0
1.4k
メール送信サーバの集約における透過型SMTP プロキシの定量評価 / Quantitative Evaluation of Transparent SMTP Proxy in Email Sending Server Aggregation
linyows
0
890
CV_5_3dVision
hachama
0
110
Explanatory material
yuki1986
0
260
機械学習 - SVM
trycycle
PRO
1
750
生成検索エンジン最適化に関する研究の紹介
ynakano
2
850
データベース06: SQL (3/3) 副問い合わせ
trycycle
PRO
0
510
Featured
See All Featured
Code Review Best Practice
trishagee
68
18k
Scaling GitHub
holman
459
140k
Building Adaptive Systems
keathley
41
2.6k
A better future with KSS
kneath
239
17k
Building Better People: How to give real-time feedback that sticks.
wjessup
368
19k
Large-scale JavaScript Application Architecture
addyosmani
512
110k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
1
61
Measuring & Analyzing Core Web Vitals
bluesmoon
7
460
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.5k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
25
2.8k
Gamification - CAS2011
davidbonilla
81
5.3k
Become a Pro
speakerdeck
PRO
28
5.3k
Transcript
第5回眼科AI学会総会 眼科AIコンテスト解析内容
解析環境 【解析環境】 Google Colaboratory (使用GPU:A100) 【使用したプログラミング言語】 Python 【主に使用したライブラリ】 Pytorch Lightning,
timm, AutoGluon クラウド上の環境構築済みの解析環境を使用した
解法の全体像 前処理 モデル構築 アンサンブル 引用: http://www.joir.jp/data/
前処理:Ben‘s Preprocessing ・2015年にKaggleで開催された糖尿病網膜症の重症度を予測する 「Diabetic Retinopathy Detection」で有効と報告された。 ・ 画像の各ピクセルについて、その周囲の一定範囲内のピクセルの平均 的な色(局所平均)を計算し、その値を各ピクセルから引く。 ・局所平均色を「50%グレー」、RGB値が約
(128, 128, 128) の中間的な明 るさになるように補正する。 Graham B. Kaggle diabetic retinopathy detection competition report. University of Warwick; 2015.
モデル構築時に工夫したこと ①画像分類モデルと特徴量抽出モデル、表データモデルを使用し、 異なるアプローチで汎化性能の向上を目的とした。 ②特徴量抽出モデルでは、多くの眼底写真を学習済みである公開モデル を使用することで、汎化性能の向上に取り組んだ。 ③より正確な性能評価を実施するため全モデルで5-Fold Cross Validationを 用いて、性能評価および予測を実施した。 ④画像分類モデルでは、データ拡張を訓練時のみではなく、予測時にも
回転等のデータ拡張を実施するTest Time Augmentation (TTA)を採用した。
①画像分類モデル 学習用データ 予測結果 訓練 1 2 (例)眼底写真 引用: http://www.joir.jp/data/ 分類
メタボリックシンドローム あり: 0.80 なし: 0.20 尤度 画像からMETSを予測するモデル
使用した事前学習済モデル一覧 1.efficientvit_b2.r288_in1k 2.tiny_vit_21m_384.dist_in22k_ft_in1k 3.xcit_small_12_p16_224.fb_dist_in1k 4.coatnet_2_rw_224.sw_in12k_ft_in1k 5.tf_efficientnet_b3.ns_jft_in1k 6.inception_next_tiny.sail_in1k 7.efficientnetv2_rw_m.agc_in1k 8.convformer_m36.sail_in22k_ft_in1k 9.wide_resnet50_2.racm_in1k
10.mobilenetv3_large_100.ra_in1k 11.efficientnet_b0.ra_in1k 様々な構造を持つモデルを構築した
②特徴量抽出モデル【RETFound, RET-CLIP】 学習用データ 特徴量 公開モデル 1 2 (例)眼底写真 引用: http://www.joir.jp/data/
特徴量 画像から特徴量(表データ)を抽出 Feature1 Featuer2 File1 1.3438 -3.5634 File2 -2.5326 3.6456
基盤モデル:RETFound ・2023年Nature誌に掲載、160万枚の眼底写真を学習した基盤モデル ・糖尿病性網膜症や緑内障などの眼疾患以外にも、パーキンソン病、脳 卒中、心不全などの全身疾患の発症を予測するといった様々なタスクに 応用が可能 https://github.com/rmaphoh/RETFound_MAE
基盤モデル:RET-CLIP ・2024年arXivに掲載、約39万枚の眼底写真を学習した基盤モデル ・画像と診療情報に関するテキストデータの両方の特徴を学習しており、 様々な眼疾患の診断タスクにおいてより高精度な病期を含めた診断が可 能となる。 https://github.com/sStonemason/RET-CLIP
③年齢推定モデル【JOIR年齢推定モデル】 学習用データ 年齢 公開モデル 1 2 (例)眼底写真 引用: http://www.joir.jp/data/ 回帰
JOIR公開モデルを用いて年齢を予測した Age File1 49 File2 28
年齢評価モデル<JOIR> ・Japan Ocular Imaging Registryで収集されたデータを用いて、 眼底写真から年齢を推定する公開モデル ・健康診断施設(単施設)より収集した眼底異常所見がなく、身体状況 が健康であった12,734人12,734枚のデータを使用 ・実年齢とAIモデルが予測した 年齢との平均的な絶対値の誤差が2.39歳
という性能で予測可能なモデル http://www.joir.jp/data/
④抽出した特徴量による表形式モデル 学習用データ 学習 (精度で評価) 1 (例)表データ 表データから予測するAutoMLに基づくモデルを構築 Feature1 Featuer2 Age
File1 1.3438 -3.5634 49 File2 -2.5326 3.6456 28 予測結果 2 分類 メタボリックシンドローム あり: 0.80 なし: 0.20 予測確率 1. RETFound特徴量 + 予測年齢 2. RET-CLIP特徴量 + 予測年齢
AutoGluon 数行のコードで性能の高いモデルが構築可能なAutoML ・表データに対する機械学習モデルを自動で構築。 ・データの前処理、モデルの選択、チューニングまでを自動化する。 (参考)
⑤アンサンブルモデル 画像分類モデル 1.efficientvit_b2.r288_in1k 2.tiny_vit_21m_384.dist_in22k_ft_in1k 3.xcit_small_12_p16_224.fb_dist_in1k 4.coatnet_2_rw_224.sw_in12k_ft_in1k 5.tf_efficientnet_b3.ns_jft_in1k 6.inception_next_tiny.sail_in1k 7.efficientnetv2_rw_m.agc_in1k 8.convformer_m36.sail_in22k_ft_in1k
9.wide_resnet50_2.racm_in1k 10.mobilenetv3_large_100.ra_in1k 11.efficientnet_b0.ra_in1k 加重平均 アンサンブル モデル① 表データモデル 1. RETFound特徴量 + 予測年齢 2. RET-CLIP特徴量 + 予測年齢 平均精度: 0.6666 平均精度: 0.6372 平均精度: 0.6428 加重平均 アンサンブル モデル② 平均精度: 0.6676 異なる複数のモデルを検討し、汎化性能の向上を目指した
最後に ・このような画像における実践的なディープラーニングの学習機会を設 けていただきました日本眼科AI学会及び関係者の皆様に感謝申し上げま す。 ・画像解析の経験がない状態でしたが、画像解析自体はハードルが高く ないものであることを実感できたとともに、画像による分類というタス ク1つに対して無数のアプローチが存在することに感銘を受けました。 ・今後も機械学習の勉強、今回習得した技術を医療に貢献できるように チャレンジしていきたいと思います。