Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
勾配ブースティングと決定木の話 / gradient boosting and decisio...
Search
kaityo256
PRO
April 23, 2026
Education
1.2k
6
Share
勾配ブースティングと決定木の話 / gradient boosting and decision trees
kaityo256
PRO
April 23, 2026
More Decks by kaityo256
See All by kaityo256
GNU Makeの使い方 / How to use GNU Make
kaityo256
PRO
16
5.7k
この講義について / 00-setup
kaityo256
PRO
2
380
GitHubによるWebアプリケーションのデプロイ / 07-github-deploy
kaityo256
PRO
2
300
演習:Gitの基本操作 / 04-git-basic
kaityo256
PRO
1
520
演習:Gitの応用操作 / 05-git-advanced
kaityo256
PRO
1
300
演習:GitHubの基本操作 / 06-github-basic
kaityo256
PRO
1
360
バージョン管理とは / 01-a-vcs
kaityo256
PRO
1
340
Gitの仕組みと用語 / 01-b-term
kaityo256
PRO
1
400
計算物理におけるGitの使い方 / 01-c-compphys
kaityo256
PRO
2
630
Other Decks in Education
See All in Education
Why the humanities may be your best career bet
figarospeech
0
190
Alumnote inc. Company Deck
yukinumata
1
18k
Science Tokyo国際卓越研究大学計画_202604
sciencetokyo
PRO
0
3.1k
Data Management and Analytics Specialisation
signer
PRO
0
1.8k
SSH_handshake_easy_explain
kenbo
0
970
Lectura 2 (PIT : Python Basico)
robintux
0
310
AWS Certified Generative AI Developer - Professional Beta 不合格体験記
amarelo_n24
1
270
JAWS-UG初心者支部#81 GWにEduJAWSと何か作ろうもくもく会!
otsuki
0
120
Tangible, Embedded and Embodied Interaction - Lecture 7 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
2.2k
Lectura 1 (PIT : Python Basico)
robintux
0
310
理工学系 第1回大学院説明会2026|東京科学大学(Science Tokyo)
sciencetokyo
PRO
1
2.5k
We部コミュニティスライド2026-04-24
junhat6
0
170
Featured
See All Featured
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
510
Context Engineering - Making Every Token Count
addyosmani
9
910
Balancing Empowerment & Direction
lara
6
1.1k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.8k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
150
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
230
First, design no harm
axbom
PRO
2
1.2k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
1.1k
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.2k
Claude Code のすすめ
schroneko
67
220k
Chasing Engaging Ingredients in Design
codingconduct
0
200
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
Transcript
1 25 2026年4月23日 研究室ミーティング 勾配ブースティングと決定木の話 慶應義塾大学理工学部物理情報工学科 渡辺
2 25 LightGBMを理解したい • LightGBMはマイクロソフトが開発した決定木 ベースの勾配ブースティングのフレームワーク • 勾配ブースティングとは、ブースティングの一種 • ブースティングとはアンサンブル学習の一種
アンサンブル学習とは? 決定木とは?
3 25 アンサンブル学習 「弱い」モデルを組み合わせて「強い」モデルを作る Bagging Input Output Boosting Input Output
※並列つなぎのようなもの ※直列つなぎのようなもの
4 25 Bagging (1/3) 不正確な時計しか手に入らないとする
5 25 Bagging (2/3) 不正確な時計をみんなでチェックして平均したら 正確な時間がわかる(かもしれない)
6 25 Bagging(3/3) (まとめて見ると)強いモデル 多数決や平均 弱いモデル より信頼できる出力 不正確な出力
7 25 ブースティング (1/3) データ 二つのクラスに分類したい
8 25 ブースティング (2/3) 誤って分類されたデータ
9 25 ブースティング (3/3) 誤って分類されたデータの重みを大きくする ・・・ 前のモデルの出力を見て、次のモデルが出力を改善していく 前のモデルが間違えたデー タを間違いにくくなる
10 25 勾配ブースティング (1/4) {𝑥𝑖 , 𝑦𝑖 } 𝑦𝑖 =
𝑓 𝑥𝑖 データセット 以下を満たす関数を作りたい 表現力が低い関数を組み合わせて表現力が高い関数を作る 𝑓 𝑥 ~ ሚ 𝑓𝐿 𝑥 = 𝑘=1 𝐿 𝑔𝑘 (𝑥) {𝑥𝑖 , 𝑦𝑖 } 𝑔1 (𝑥) {𝑥𝑖 , 𝑦𝑖 − ሚ 𝑓1 𝑥 } 𝑔2 (𝑥) 𝑔3 (𝑥) ・・・・ {𝑥𝑖 , 𝑦𝑖 − ሚ 𝑓2 𝑥 } レベル1関数の残差を学習 レベル1関数を学習 レベル2関数の残差を学習
11 25 勾配ブースティング (2/4) {𝑥𝑖 , 𝑦𝑖 } データセット ሚ
𝑓1 𝑥 = 𝑔1 (𝑥) 弱いモデル(レベル1) 𝐶 = 𝑖 𝑦𝑖 − 𝑔1 𝑥𝑖 2 平均自乗誤差を最小化 このデータを ステップ関数の和で表現
12 25 勾配ブースティング (3/4) レベル1のフィッティング結果 レベル1残差 𝐶 = 𝑖
𝑟𝑖 − ሚ 𝑓1 𝑥𝑖 2 𝑔2 (𝑥) をレベル1残差を減らすよう訓練 {𝑥𝑖 , 𝑦𝑖 − ሚ 𝑓1 𝑥 }
13 25 勾配ブースティング (4/4) レベル15関数による近似 ሚ 𝑓15 𝑥 モデルを繋いで誤差を減らし、全体として精度を高める
14 25 勾配と残差 (1/2) 𝑦𝑖 = 𝑓 𝑥𝑖 ሚ 𝑓𝐿
(𝑥) = 𝑘=1 𝐿 𝑔𝑘 (𝑥|𝜃𝑘 ) 目的関数 レベルL近似 (𝑔1 (𝑥)から𝑔𝐿 (𝑥)まで使った近似関数) 𝐶𝐿 ( 𝑦𝑖 , ሚ 𝑓𝐿 (𝑥)) レベルLにおけるコスト関数 − ቤ 𝜕𝐶𝐿 𝜕 ሚ 𝑓𝐿 𝑥 レベルLにおけるコスト関数の負の勾配を 目的関数として𝑔𝐿+1 学習させる {𝑔0 , 𝑔1 , ⋯ , 𝑔𝐿 } → 𝑔𝐿+1 ブースティング 勾配に関する − ቤ 𝜕𝐶𝐿 𝜕 ሚ 𝑓𝐿 𝑥
15 25 勾配と残差 (2/2) 𝐶𝐿 = 𝑖 1 2
𝑦𝑖 − ሚ 𝑓𝐿 𝑥𝑖 2 コスト関数として自乗誤差の和を採用すると − 𝜕𝐶𝐿 𝜕 ሚ 𝑓𝐿 𝑥𝑖 = 𝑦𝑖 − ሚ 𝑓𝐿 𝑥𝑖 コスト関数の負の勾配が残差に一致する 残差を目的関数としたブースティングは 勾配ブースティングの特別な場合
16 25 決定木 決定木:木構造を使った予測モデル Yes No Yes No 卵を生むか? 恒温動物か?
哺乳類 鳥類 ・・・ ※この分類例がいい加減なのは許して
17 25 決定木による回帰 (1/2) • 𝑥1 : 最寄り駅までの時間(徒歩𝑥1 分) •
𝑥2 : 部屋の広さ(𝑥2 𝑚2) 特徴量 • 𝑦: 妥当な家賃 目的変数 与えられた条件から「相場」を知りたい (𝑥1 , 𝑥2 ) → 𝑦
18 25 決定木による回帰 (2/2) 𝑥1 > 𝜃1 𝑥2 > 𝜃2
𝑥2 > 𝜃3 Yes No Yes No Yes No 𝑦1 𝑦2 𝑦3 𝑦4 𝑥1 𝑥2 𝑦 決定木 ニューラルネットワーク 決定木は解釈しやすい 駅からどれくらい遠いか? 部屋はどれくらいの広さか? ノードの役割が 分かりづらい
19 25 決定木による分類 Class A: 円の内部 𝑥2 + 𝑦2 ≤
𝑟2 Class B: 円の外部 𝑥2 + 𝑦2 > 𝑟2 線形な不等式(弱いモデル)だけを使って上記の分類問題を解きたい 𝑥 𝑦 𝑥 > 𝑥𝑐 , 𝑦 > 𝑦𝑐 (𝑥𝑖 , 𝑦𝑖 )
20 25 分類結果: 深さ1 予測結果 𝑥 < −0.91 決定木
21 25 分類結果: 深さ2 𝑥 < −0.91 𝑥 < −0.97
𝑥 < 0.88 予測結果 決定木
22 25 分類結果: 深さ3 予測結果 決定木
23 25 分類結果: 深さ5 (1/2) 予測結果
24 25 分類結果: 深さ5 (2/2) 決定木 展開しても効果が薄い ノードは展開しない
25 25 まとめ • アンサンブル学習とは、弱いモデルを複数組み合わ せて強いモデルを作る手法 • ブースティングとはアンサンブル学習の一種であり、 弱いモデルを直列に繋いで強いモデルを作る手法 •
勾配ブースティングとは、一つ前の近似によるコス ト関数の負の勾配を次のモデルに学習させることで 全体のロスを下げる方法 (コスト関数として平均自乗誤差を採用すると前のモ デルの残差を学習させることに帰着) • 決定木とは単純な条件分岐を再帰的に繰り返すこと で分類や回帰を行う手法