Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データセットシフト・Batch Normalization
Search
Taro Nakasone
September 05, 2025
Research
22
0
Share
データセットシフト・Batch Normalization
※過去に作成した資料の内部共有用の掲載です
Taro Nakasone
September 05, 2025
More Decks by Taro Nakasone
See All by Taro Nakasone
[輪講] Transformer(大規模言語モデル入門第2章)
taro_nakasone
0
43
次元削減・多様体学習 /maniford-learning20200707
taro_nakasone
2
1.9k
論文読み:Identifying Mislabeled Data using the Area Under the Margin Ranking (NeurIPS'20) /Area_Under_the_Margin_Ranking
taro_nakasone
0
210
Other Decks in Research
See All in Research
定数整数除算・剰余算最適化再考
herumi
1
110
「なんとなく」の顧客理解から脱却する ──顧客の解像度を武器にするインサイトマネジメント
tajima_kaho
10
7.5k
Using our influence and power for patient safety
helenbevan
0
340
はじまりの クエスチョンブック —余暇と豊かさにあふれた社会とは?
culturaltransition
PRO
0
410
東京大学工学部計数工学科、計数工学特別講義の説明資料
kikuzo
0
380
20年前に50代だった人たちの今
hysmrk
0
200
[チュートリアル] 電波マップ構築入門 :研究動向と課題設定の勘所
k_sato
0
420
2026年1月の生成AI領域の重要リリース&トピック解説
kajikent
0
1k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
240
LINEヤフー データサイエンス Meetup「三井物産コモディティ予測チャレンジ」の舞台裏-AlpacaTechパート
gamella
1
490
多様なデータを許容し学習し続ける模倣学習 / Advanced Imitation Learning for VLA
prinlab
0
180
重要だけど測れていないもの:高齢者ケアの見えない課題
theoriatec2024
0
210
Featured
See All Featured
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
200
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
150
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
550
Building a Scalable Design System with Sketch
lauravandoore
463
34k
SEO for Brand Visibility & Recognition
aleyda
0
4.5k
The Cost Of JavaScript in 2023
addyosmani
55
9.9k
GraphQLの誤解/rethinking-graphql
sonatard
75
12k
HDC tutorial
michielstock
2
660
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
3k
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
0
310
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.9k
Testing 201, or: Great Expectations
jmmastey
46
8.1k
Transcript
データセットシフト 仲宗根太朗・櫻井研究室 学会名・セッション名・発表年月日・開催場所
はじめに ◼以下のデータシフトの問題設定がある ⚫Covariate Shift ⚫Target Shift ⚫Concept Shift ⚫Sample Selection
Bias ⚫Domain Shift ◼ただし,それそれの問題が必ずしも独立ではない
はじめに ◼以下のデータシフトの問題設定がある ⚫Covariate Shift ⚫Target Shift ⚫Concept Shift ⚫Sample Selection
Bias ⚫Domain Shift ◼ただし,それそれの問題が必ずしも独立ではない
Covariate Shift ◼定義 学習時とテスト時で入力変数の周辺分布が異なるという問題設定
Target Shift ◼定義 学習時とテスト時で出力変数の周辺分布が異なるという問題設定
Concept Shift ◼定義 学習時とテスト時で条件付き確率分布が異なるという問題設定
Sample Selection Bias ◼定義 観測データをデータセットに含めるかどうかを決める隠れた関数ξ が存在し,この関数が学習時とテスト時で異なるという問題設定
Domain Shift 潜在的に同じものを説明しているにも関わらず,計測技術や環境の違い などの影響で変数が異なってしまう問題設定
対策手法 ◼以下のような対策手法がある ⚫Batch Normalization
Batch Normalization ◼解決したい問題 − Internal Covariate Shift ⚫深層モデルにて,インプットの分布がころころ変わる ◼解決方法 ⚫レイヤごとのインプットを正規化しようという発想
⚫ただし,パラメータ更新の度に学習データ全体をネットワークに 流して,各レイヤのインプットを求め正規化を行うのは効率悪い ⚫そこでミニバッチごとの統計量を使って,ミニバッチごとに簡易 的な正規化を行う
Batch Normalization ◼解決したい問題 − Internal Covariate Shift ⚫深層モデルにて,インプットの分布がころころ変わる ◼解決方法 ⚫レイヤごとのインプットを正規化しようという発想
⚫ただし,パラメータ更新の度に学習データ全体をネットワークに 流して,各レイヤのインプットを求め正規化を行うのは効率悪い ⚫そこでミニバッチごとの統計量を使って,ミニバッチごとに簡易 的な正規化を行う
Batch Normalization ◼解決したい問題 − Internal Covariate Shift ⚫深層モデルにて,インプットの分布がころころ変わる ◼解決方法 ⚫レイヤごとのインプットを正規化しようという発想
⚫ただし,パラメータ更新の度に学習データ全体をネットワークに 流して,各レイヤのインプットを求め正規化を行うのは効率悪い ⚫そこでミニバッチごとの統計量を使って,ミニバッチごとに簡易 的な正規化を行う
Batch Normalization ◼解決したい問題 − Internal Covariate Shift ⚫深層モデルにて,インプットの分布がころころ変わる ◼解決方法 ⚫レイヤごとのインプットを正規化しようという発想
⚫ただし,パラメータ更新の度に学習データ全体をネットワークに 流して,各レイヤのインプットを求め正規化を行うのは効率悪い ⚫そこでミニバッチごとの統計量を使って,ミニバッチごとに簡易 的な正規化を行う
Batch Normalization ◼アルゴリズム
Batch Normalization ◼ミニバッチごとの平均分散を計算する
Batch Normalization ◼正規化を行う
Batch Normalization ◼正規化を行う 分母に𝜖を加えていますが、これ は微小値を表し、𝝈𝑩 𝟐 が小さい場 合に計算を安定されるため
Batch Normalization ◼レイヤの非線形性に対応させる調整
Batch Normalization ◼平均と分散の調節 単純にෞ 𝒙𝒊 をインプットとすると, 本来レイヤが持つ非線形性の表現 力を失っている可能性がある
Batch Normalization ◼例えば,シグモイド関数の場合
Batch Normalization ◼例えば,シグモイド関数の場合 インプットが-1から1の範囲で はほぼ線形になっている
Batch Normalization ◼この解決策として
Batch Normalization ◼以下のように横にシフト,スケール変化すれば良い
Batch Normalization ◼それを踏まえて,
Batch Normalization ◼平均に対応するパラメータ𝜷と分散に対応する𝜸を導入
Batch Normalization ◼平均に対応するパラメータ𝜷と分散に対応する𝜸を導入 ෞ 𝒙𝒊 を𝜷の分だけ横にシフト, 𝜸でスケールを変更できる.