Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文紹介 Editing Models with Task Arithmetic
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
yabea
February 15, 2024
Programming
940
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
論文紹介 Editing Models with Task Arithmetic
yabea
February 15, 2024
More Decks by yabea
See All by yabea
Generative Dog Images 2nd place solution (Japanese)
yabea
3
690
Other Decks in Programming
See All in Programming
依存関係から依存物へ―Dependencyという言葉の歴史をひも解く
j_lee
0
120
「AIで開発し、AIを届ける」をEvalでつなぐ 〜AIネイティブに始めるプロダクト開発の実践〜 / Connecting "Develop with AI, deliver AI" with Eval
rkaga
4
5.1k
Java × distroless で 軽量なコンテナイメージを / Java on Distroless
contour_gara
0
540
セキュリティの専門家じゃなくてもできる。「セキュリティ意識」をアップデートして サプライチェーン攻撃への耐性を高めよう。
tk3fftk
5
760
dRuby over BLE
makicamel
2
340
LLMによるContent Moderationの本番運用の裏側と品質担保への挑戦
suikabar
3
680
「なぜそう決めたのか」を残し続ける仕組み ― Notion AI カスタムエージェント × Slack連携による設計判断の自動記録 - NIKKEI Tech Talk #47
niftycorp
PRO
0
170
Observability in Practice:Grafana 與 Edge Device SRE 的那些事
blueswen
0
160
エンジニアと一緒にテストコードの設計と実装を改善した話
mototakatsu
0
180
肥大化するレガシーコードに立ち向かうためのインターフェース分離と依存の逆転 / JJUG CCC 2026 Spring
hirokunimaeta
0
560
ECSアプリログをFireLensでコスト削減しようとしたけど諦めた話 in Fargate×Node.js
akihisaikeda
2
4.2k
AIだと陥りがちなJakarta EE最新技術への移行時の落とし穴と解決策
tnagao7
0
110
Featured
See All Featured
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
730
The World Runs on Bad Software
bkeepers
PRO
72
12k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
201
75k
Utilizing Notion as your number one productivity tool
mfonobong
4
320
Principles of Awesome APIs and How to Build Them.
keavy
128
18k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
Are puppies a ranking factor?
jonoalderson
1
3.6k
The Spectacular Lies of Maps
axbom
PRO
1
810
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
160
A Tale of Four Properties
chriscoyier
163
24k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
10k
Accessibility Awareness
sabderemane
1
140
Transcript
AI 2023.04.21 Yuki Abe 株式会社ディー・エヌ・エー Editing Models with Task Arithmetic
AI 2 • 阿部 佑樹 • 経歴 ◦ 慶應義塾大学 今井研究室
◦ 2021年 DeNA入社 • 趣味 ◦ コンペティション参加 @yabea ◦ ゲーム ▪ スプラ ▪ ポケスリ ◦ ポーカー 自己紹介
AI 3 G. Ilharco, M. Ribeiro, M. Wortsman, L. Schmidt,
H. Hajishirzi, and A. Farhadi, "Editing models with task arithmetic" inProc. of ICLR, 2023. 紹介論文: Editing Models with Task Arithmetic ※ 本スライドにおいて注釈がない画像は全て論文から引用したものです • Task Arithmetic という性質を画像や言語の幅広い分野で実験的に証明 ◦ 重みの引き算による忘却 ◦ 重みの足し算による学習 ◦ タスクのアナロジーの活用 • ICLR 2023 採択 https://iclr.cc/virtual/2023/poster/12254
AI 4 項目 01|タスクベクトルについて 02|減算による忘却 03|加算による学習 04|タスクのアナロジーの活用
AI 5 01 タスクベクトルについて
AI 6 • タスクベクトル ◦ ファインチューンによって更新した分の重み ◦ [Task vector] =
[Fine-tuned weight] - [Pre-trained weight] • アーキテクチャが同じモデル間で要素ごとの加算が可能 ◦ [New model] = [Old model] + λ [Task vector] ◦ λ はハイパラ ▪ 実験ではValidationデータで調整 タスクベクトルとは
AI 7 02 減算による忘却
AI 8 • モデルから望ましくないバイアスや挙動のみを取り除く ◦ 例: ▪ 画像分類の結果がOCRに引っ張られることを抑制したい ▪ 言語モデルにおいて有害なコメントを生成する挙動を抑制したい
• タスクベクトルを減算することで実現 ◦ [New model] = [Old model] - λ [Task vector] = [Old model] - λ ([Fine-tuned] - [Old model]) 減算による忘却とは タスクベクトル を展開
AI 9 • CLIPを利用 ◦ SUN-397の画像に誤答クラス名を文字入れ ◦ [New model] =
[CLIP] - λ ([文字入れクラス名を当てるファインチュー ンをしたCLIP] - [CLIP]) • ImageNet精度を損なうことなくOCRへの依存を抑制 画像分類における忘却実験 画像引用元 https://openai.com/research/clip
AI 10 • GPT-2を利用 ◦ Civil Commentsデータセットのtoxicity>0.8でLM ◦ [New model]
= [GPT-2] - λ ([有害テキストを生成するようにファイン チューンしたGPT-2] - [GPT-2]) • WikiTextのperplexityを損なうことなくtoxicityを抑制 文章生成における忘却実験 toxicity -4%削減 ほぼ性能 悪化せず
AI 11 03 加算による学習
AI 12 • タスクベクトルの加算でモデルの性能を向上させる ◦ マルチタスクモデル化 ◦ シングルタスクの精度向上 • 複数のタスクベクトルを加算することで実現
◦ [New model] = [Old model] + λ (SUM([Task vector 1], ...)) 加算による学習とは
AI 13 • CLIPを使用 ◦ 8つのタスクで個別にファインチューン→8つのタスクベクトル ◦ 8C2個のタスクペアでタスクベクトルの加算を実行 ▪ [New
model] = [CLIP] + λ ([Task vector 1] + [Task vector 2]) • 個別モデルとほぼ同等の精度でデュアルタスク化に成功 画像分類におけるマルチタスクモデル化実験 個別にファインチューンした モデルの精度を1.0とする Zero-shotは相対精度0.69くらい Task 1,2 の両方で相対精度0.99くらい
AI 14 • T5ベースのモデルを使用 ◦ GLUEの4つのタスクで個別にファインチューンしたものを始点 ◦ HuggingFaceから互換性のある重み427個を取得 ▪ 427個のタスクベクトルを検証スコアが最大になるよう選択し加算
• 個別モデルから更に精度が向上 GLUEベンチマークにおける精度向上実験 精度向上
AI 15 04 タスクのアナロジーの活用
AI 16 • タスクDを解くモデルDを作りたい ◦ タスクDはデータが全く/ほとんどない ◦ “A is to
B as C is to D”を満たすタスクA~CのモデルA~Cはある • モデルA~Cの加減算でモデルDを表現 “A is to B as C is to D” [タスクD] = [タスクC] + ([タスクB] - [タスクA])
AI 17 • T5ベースのモデルを使用 ◦ Yelpの感情分類をzero-shotで解く ▪ Yelpはラベルのみない状況 ▪ Amazonの感情分類の教師データあり
◦ [Yelp;sent] = [Yelp;LM] + λ ([Amazon;sent] - [Amazon;LM]) • Yelpの感情分類をファインチューンしたモデルに匹敵する精度 文章感情分類におけるタスクアナロジーの実験 Yelp;LM, Amazon;sent, Amazon;LMを同時に訓練 (入力データがAmazonなら 感情分類タスクも解く)
AI 18 • CLIPを使用 ◦ ImageNetとHuman SketchからA~Dの4つのタスクを作成 ◦ A~Dのどれをターゲットにするかで計4つの実験 ▪
[D: Sketch 2] = [C: Image 2] + λ ([B: Sketch 1] - [A: Real 1]) ▪ [D: Sketch 2] と [CLIP] のそれぞれで Few-shot Learning • Zero-/Few-shotでタスクベクトル作モデルが常に良い精度 画像分類におけるタスクアナロジーの実験 タスクアナロジーモデル ≒ 教師ありデータ100件モデル ラベル グループ① ラベル グループ② ImageNet A C Human Sketch B D dog, apple, ... lion, castle, ... グループ分けのイメージ
AI 19 まとめ
AI 20 • Editing Models with Task Arithmetic の論文を紹介 •
重みの加減算でタスクの学習や忘却が可能 まとめ