画像コンペでのベースラインモデルの育て方

画像コンペでのベースラインモデルの育て方 GOドライブ株式会社福井尚卿 (@tattaka_sun)

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 2 自己紹介名前：tattaka - kaggle: https://www.kaggle.com/tattaka -
Twitter: https://x.com/tattaka_sun 趣味： • 熱帯魚飼育 ◦ 南米の中型肉食魚 • ランニング ◦ 暑いのでサボりがち Kaggleはほぼ画像系のみ・仕事でも画像認識をやっています

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 3 はじめに（1/2）画像コンペの上位解法ではアイディア勝負のイメージがあるかもしれませんが、意外と細かいチューニングや汎用的なテクニックの「積み上げ」も大事だったりしますベースラインからの積み上げが大事だったコンペの例↓

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 4 はじめに（2/2）本LTでは、公開Notebookなどのシンプルなベースラインモデルをを作った後の「どうベースラインモデルを育てていくか」に焦点を当てて普段使っているテクニックや気をつけていることなど事例とともに紹介します

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 5 このLTで話すこと - 「良い」ベースラインモデルとは - I/O・CPU処理を高速化して実験回数を増やそう -
ハイパラチューニングの勘所 - すぐに使える色々なテクニック - アイディアを出すために

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 6 良いベースラインモデルとは前提として、実験を重ねる前に良いベースラインモデルを作ることが大事 - 実装について把握できている -
リークしていない - Trust CVかTrust LBかの方針を定めた上で、適切に評価ができている - など - 参考: 競技としてのKaggle、役に立つKaggle

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 7 I/O・CPU処理を高速化する（1/2）細かい試行を重ねるためには実験の高速化が必須意外とモデルの学習部分よりI/OやCPU処理がボトルネックになっていることも多い - jpg・pngをnumpy形式で保存する
- 精度低下しないならﬂoat16・uint8で保存する - tfrecord・hdf5・np.memmapなど部分的にデータを読み込める形式を使う - DataLoaderクラスのnum_workers・prefetch_factor の設定を見直す

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 8 I/O・CPU処理を高速化する（2/2） CPUで動いているnumpyなどの処理をTorchを使ってGPUに載せる例：CZIIコンペでの後処理 np.ndarray torch.Tensor

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 9 ハイパラチューニングの勘所（1/5）モデル設計まわり - 事前学習済みモデル（timm models）の選び方 -
以下から選ぶことが多いです - CNN系統 - ResNet-RS・ResNeSt・ConvNeXt V1/V2・ConvFormer・ EﬃcientNet V1/V2・RDNet・InceptionNeXt - ViT系統 - SwinT V1/V2・CAFormer・MaxViT・EﬃcientViT_b*/l* - ResNet系統は学習しやすく、初手で使いがち - 3DタスクだとResNet*-irCSN など

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 0 ハイパラチューニングの勘所（2/5） - drop_path_rate - 学習時にモデルのlayerの一部をskipすることで汎化性能を上げる
DropPathの適用割合を決めるパラメータ - 一部のモデルでは使えない（EﬃcientViT_b*/l*・ResNeStなど） - headの設計 - 何層にするか - Dropout・BatchNormを入れるか - （分類の場合）どのPooling層を使うか - UNet系ならどのAttentionを使うか（CBAM・SCSEなど）

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 11 ハイパラチューニングの勘所（3/5）学習設定まわり - optimizer - AdamW・AdamWがうまくいかない場合はSGD
- 最近だとMuonも良いらしいですが使ったことがないので試してみたい - 学習率のチューニング - AdamWだと1e-3 ~ 1e-5でいいところを探す - 事前学習済み部分とそれ以外で学習率を変えた方が良いことも - 個人的には事前学習済み部分を小さめに設定することが多い - warmup - 多くの場合入れた方が学習が安定する

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 2 ハイパラチューニングの勘所（4/5） - AdamWのパラメータ - weight
decay: 1e-2 ~ 1e-5の間でチューニング - eps: 1e-6 ~1e-8でチューニング - 小さいと性能は良いが安定性が悪くなることが多い印象 - fp32の時は1e-8・fp16の時は1e-6をよく使います - epoch数 - なるべくEarly Stoppingはしないようにチューニングする (のが理想) - last = bestにならない場合も多いので様子を見ながら調整する - batch size - 大きい方が良い場合・小さい方が良い場合どちらもあるので調整する

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 3 ハイパラチューニングの勘所（5/5）入力画像への前処理 - data augmentation
- Flip・Rot90を基本に処理後の画像を目視で確認しながら追加していく - ShiftScaleRotate・RandomBrightnessContrast・CouarseDropout あたりは良く使う - 入力画像の解像度を変える - 計算リソース上の制限（batch size・学習時間）を見比べながら調整 - 入力画像の正規化 - 基本的にはデータセット全体の統計で正規化 - 画像単位・画像系列単位の統計で正規化すると良いことも

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 4 すぐに使える色々なテクニック（1/5） - 公開モデルを改造する - bilzardさんの記事が参考になる:
野生のモデルを飼い慣らす - よくやるのは浅い層のconv層のstrideを小さくして実質的に解像度を上げるなど（計算量には注意） - 地震波コンペの公開Notebook

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 5 すぐに使える色々なテクニック（2/5） - Exponential Moving Average（EMA）
- 学習中にstepごとにモデルウェイトの移動平均を取る手法 - 収束は遅くなるが、val_loss・metricが安定する - epoch数と一緒に調整する - 汎化性能も上がってそう（お気持ち）なので EMA前提でベースライン構築をすることも多い - timm.utils.ModelEmaV3 が便利 - Label Smoothing - 0/1ラベルを0.1/0.9のように変換し、モデルがラベルノイズに対して敏感にならないようにする

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 6 すぐに使える色々なテクニック（3/5） - Mixup・CutMix - 2つの学習データを混合して新しい学習データを作る手法
- 入力画像を混ぜる代わりに中間層の出力を混ぜる Manifold Mixupも有効なことがある - 最終層でMIXUPしたら良さげだった件 - targetを混ぜる・lossを混ぜるのどちらもある - 個人的には後者が好きだが、タスクによって改造しやすいのは前者 - targetを重み付け和ではなく論理和で混ぜる例： SETIコンペ 2nd solution

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 7 すぐに使える色々なテクニック（4/5）データ不均衡への対処 - FocalLoss・Online Hard
Example Mining（OHEM） - 少数クラス＝学習が難しいサンプルとみなして重みを増やす手法 - BCEWithLogitsLossのpos_weight、CrossEntropyLossのweight を調整して少数クラスの重みを増やす - オーバー・ダウンサンプリング - 少数データを水増しする or 多数データを間引く - 適切なepoch数も変わってくるので適宜修正

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 8 すぐに使える色々なテクニック（5/5） - 閾値の最適化 - メトリック計算に閾値が必要な場合、0.5などを決めうちで閾値を切る
よりもscipy.optimize.minimizeを使ってCVに最適化する方が良いことが多い（オーバーフィットには注意） - パーセンタイルベースの閾値設定 - 固定値で閾値を切るのではなく、出力値のパーセンタイルで閾値を設定する手法 - モデルごとの出力値の分布のズレに頑健になる - train・val/testのGTの分布が大きく異なる時は固定値の方が良いことも

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 9 アイディアを出すために（1/2） - コンペのOverviewやDataの説明をよく読みましょう - ドメイン知識を深める
- ホストが書いたコンペ設計に関する論文を探して読む - アノテーションルールはどうなっているのか？ - 外部データはあるかどうか - etc…

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 2 0 アイディアを出すために（2/2） - 似た過去コンペの解法を参考にする - ベースラインを作る時にも有用
- Discussionは基本全て目を通した方が良い - vote数が少なくても重要な情報が書かれていることもある - EDA Notebookもあれば見ておく・自分でも動かす - エラーケース分析 - FN/FPどちらの間違え方をしているかなどを見る - 可視化して間違え方に特徴がないかを探す

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 21 最後に - いろいろなテクニックを紹介しましたが、時間・計算リソースは有限なので仮説を立ててから実験することが大事 - この施策はどういう時に効くからこんな結果になるはずだ
- 思った結果にならないならなんでだろう -> 新しい仮説を立てるの繰り返し

4th Pace Solution by team “yu4u & tattakaˮ 22

画像コンペでのベースラインモデルの育て方

画像コンペでのベースラインモデルの育て方

tattaka

More Decks by tattaka

Other Decks in Programming

Featured

Transcript

画像コンペでのベースラインモデルの育て方 GOドライブ株式会社福井尚卿 (@tattaka_sun)

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 2 自己紹介名前：tattaka - kaggle: https://www.kaggle.com/tattaka -

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 5 このLTで話すこと - 「良い」ベースラインモデルとは - I/O・CPU処理を高速化して実験回数を増やそう -

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 6 良いベースラインモデルとは前提として、実験を重ねる前に良いベースラインモデルを作ることが大事 - 実装について把握できている -

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 8 I/O・CPU処理を高速化する（2/2） CPUで動いているnumpyなどの処理をTorchを使ってGPUに載せる例：CZIIコンペでの後処理 np.ndarray torch.Tensor

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 9 ハイパラチューニングの勘所（1/5）モデル設計まわり - 事前学習済みモデル（timm models）の選び方 -

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 0 ハイパラチューニングの勘所（2/5） - drop_path_rate - 学習時にモデルのlayerの一部をskipすることで汎化性能を上げる

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 11 ハイパラチューニングの勘所（3/5）学習設定まわり - optimizer - AdamW・AdamWがうまくいかない場合はSGD

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 2 ハイパラチューニングの勘所（4/5） - AdamWのパラメータ - weight

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 3 ハイパラチューニングの勘所（5/5）入力画像への前処理 - data augmentation

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 4 すぐに使える色々なテクニック（1/5） - 公開モデルを改造する - bilzardさんの記事が参考になる:

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 5 すぐに使える色々なテクニック（2/5） - Exponential Moving Average（EMA）

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 6 すぐに使える色々なテクニック（3/5） - Mixup・CutMix - 2つの学習データを混合して新しい学習データを作る手法

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 7 すぐに使える色々なテクニック（4/5）データ不均衡への対処 - FocalLoss・Online Hard

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 8 すぐに使える色々なテクニック（5/5） - 閾値の最適化 - メトリック計算に閾値が必要な場合、0.5などを決めうちで閾値を切る

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 1 9 アイディアを出すために（1/2） - コンペのOverviewやDataの説明をよく読みましょう - ドメイン知識を深める

2025/08/07 上位Kagglerに学ぶ~画像コンペの戦い方 ~ 2 0 アイディアを出すために（2/2） - 似た過去コンペの解法を参考にする - ベースラインを作る時にも有用

4th Pace Solution by team “yu4u & tattakaˮ 22