Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NeurIPS 2024 参加報告 & 論文紹介 (SACPO, Ctrl-G)
Search
Rei Sato
January 21, 2025
Research
0
17
NeurIPS 2024 参加報告 & 論文紹介 (SACPO, Ctrl-G)
https://lycorptech-jp.connpass.com/event/339481/
Rei Sato
January 21, 2025
Tweet
Share
More Decks by Rei Sato
See All by Rei Sato
NeurIPS2023-paper-reading-PGDiff
reisato12345
0
500
NeurIPS2022_face_image_synthesis_series
reisato12345
2
910
Other Decks in Research
See All in Research
CUNY DHI_Lightning Talks_2024
digitalfellow
0
270
言語と数理の交差点:テキストの埋め込みと構造のモデル化 (IBIS 2024 チュートリアル)
yukiar
4
1k
20240918 交通くまもとーく 未来の鉄道網編(太田恒平)
trafficbrain
0
440
eAI (Engineerable AI) プロジェクトの全体像 / Overview of eAI Project
ishikawafyu
0
190
Tiaccoon: コンテナネットワークにおいて複数トランスポート方式で統一的なアクセス制御
hiroyaonoe
0
260
研究を支える拡張性の高い ワークフローツールの提案 / Proposal of highly expandable workflow tools to support research
linyows
0
250
Weekly AI Agents News! 10月号 論文のアーカイブ
masatoto
1
460
2038年問題が思ったよりヤバい。検出ツールを作って脅威性評価してみた論文 | Kansai Open Forum 2024
ran350
8
3.7k
ラムダ計算の拡張に基づく 音楽プログラミング言語mimium とそのVMの実装
tomoyanonymous
0
360
テキストマイニングことはじめー基本的な考え方からメディアディスコース研究への応用まで
langstat
1
170
「熊本県内バス・電車無料デー」の振り返りとその後の展開@土木計画学SS:成功失敗事例に学ぶ公共交通運賃設定
trafficbrain
0
120
KDD論文読み会2024: False Positive in A/B Tests
ryotoitoi
0
260
Featured
See All Featured
Music & Morning Musume
bryan
46
6.3k
Code Reviewing Like a Champion
maltzj
521
39k
Fireside Chat
paigeccino
34
3.1k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
49
2.2k
Faster Mobile Websites
deanohume
305
30k
Learning to Love Humans: Emotional Interface Design
aarron
274
40k
Side Projects
sachag
452
42k
Bash Introduction
62gerente
610
210k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
The Language of Interfaces
destraynor
155
24k
Typedesign – Prime Four
hannesfritz
40
2.5k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
Transcript
NeurIPS 2024 参加報告 & 論文紹介 (SACPO, Ctrl-G) 佐藤怜 LINEヤフー株式会社 NeurIPS
2024 論文読み会 2025/01/23
自己紹介: 佐藤怜 / Rei Sato • 筑波大学修士22卒 • LINEヤフーで機械学習エンジニア ◦
近況: LLMのR&D • NeurIPS 2022, 2023 論文読み会に続き3回目 • NeurIPS 2024に現地参加 (プロフィールHP) 2
NeurIPS 2024概要 • 機械学習のトップ国際会議 • カナダのバンクーバーで開催 • ↓ 2024年の頻出キーワード 1
Large Language Models 2 Reinforcement Learning 3 Diffusion Models 4 Graph Neural Networks 5 Transformer https://papercopilot.com/paper-list/neurips-paper-list/neurips- 2024-paper-list/ 3
会議のスケール • 投稿数: 9千(2021), 1万(2022), 1.2万(2023), 1.6万(2024) • 採択率: 約25%を維持
• Registrationは抽選が発生(著者は抽選なし) 4
• 各社のあれこれを聞いてグッズをゲットする • 博士号 or 米国での就労資格があると就活に有利 企業ブース 5
Q. なぜ現地参加 A. 論文採択 Stepwise Alignment for Constrained Language Model
Policy Optimization https://openreview.net/forum?id=VrVx83BkQX 6
発表した論文: SACPOについて(1) ChatGPTのような対話型LLMの応答の質を評価するとき 有用性(どれだけ有益な情報を提供するか)だけでなく 安全性(どれだけ有害な情報の提供をしないか)も重要 LLMレスポンス 2: 法律・安全・倫理の観点 から特別な許可なしに 試みるべきではありま
せん 有用性: レスポンス1 > レスポンス2 安全性: レスポンス1 < レスポンス2 LLMレスポンス 1: 材料Aと材料Bを器具C で加工します ユーザープロンプト : 爆弾の作り方を教えて 7
発表した論文: SACPOについて(2) 1行目前半: 有用性rの期待値を最大化するようにLLM πを学習 1行目後半: LLM πが学習前のLLM π_refから乖離しないように正則化 2行目:
安全性gの期待値がbを超えるようにLLM πを制約 解きたい問題 8
解きたければ解けばよかろう → 煩雑で不安定 [Safe RLHF] 発表した論文: SACPOについて(3) Safe RLHFの手順: (1)
有用性と安全性を評価する関数を教師あり学習 (2) これを最大化するようにLLMを強化学習 → 従来のRLHFの問題を引き継ぐ Safe RLHF: Safe Reinforcement Learning from Human Feedback https://arxiv.org/abs/2310.12773 9
SACPOの手順: (1) 有用性を最大化するようにLLMをDPO(教師あり)で学習 (2) (1)のLLMに対して更に安全性 〃 → RLHFがDPOで置換されたことで学習が安定 発表した論文: SACPOについて(4)
もっと簡便で安定した最適化はないか ? → SACPO 10
発表した論文: SACPOについて(5) Q. 実用的には優れていてもあくまで元の最適化問題への近似手法? A. いいえ,元の最適化問題に理論的に一致します 11
ファーストオーサーであるLINEヤフーの和地が解説 NLPコロキウム第71回 https://www.youtube.com/watch?v=-SKeuQibvoQ もっと詳しく 12
• 3人の発表者が個別に2.5/3時間ほど聴講者の対応をするくらい好評 • ホットな研究を積極的に宣伝するなら2~4人で臨む必要あり (コストはさておき) 発表の様子 13
論文「Ctrl-G」について(1) 2行目: 安全性gの期待値がbを超えるようにLLM πを制約 もしgがLLMの応答yがある正規表現にマッチするかどうか を判定するものだったら ...? リマインド : SACPOの最適化問題
14
Ctrl-G: 正規表現にマッチするように LLMの出力を誘導する (K) キーワードの集合を与えてそれを含むように回答する (L) 指定された範囲の長さで回答する 論文「Ctrl-G」について(2) Adaptable Logical
Control for Large Language Models https://arxiv.org/abs/2406.13892 15
LLMの追加学習はせず,推論時にトークン生成確率を操作 論文「Ctrl-G」について(3) 16 • 計算したい確率 : 生成済みトークン列x<tと制約αに条件付けられた LLMによるトークンx_tの生成確率 • 通常のLLMで計算できる確率
: 生成済みトークン列x<tに条件付けら れたLLMによるトークンx_tの生成確率 • 非自明な確率 : x<tとx_tから生成を続けて最終的に制約αを充足する 確率
論文「Ctrl-G」について(4) 17 Adaptable Logical Control for Large Language Models https://arxiv.org/abs/2406.13892
LLMをHMMで近似 & 正規表現を DFAで表現 → Forwardアルゴリズムを活用して右辺を計算する