Upgrade to Pro — share decks privately, control downloads, hide ads and more …

NeurIPS 2024 参加報告 & 論文紹介 (SACPO, Ctrl-G)

Rei Sato
January 21, 2025

NeurIPS 2024 参加報告 & 論文紹介 (SACPO, Ctrl-G)

Rei Sato

January 21, 2025
Tweet

More Decks by Rei Sato

Other Decks in Research

Transcript

  1. 自己紹介: 佐藤怜 / Rei Sato
 • 筑波大学修士22卒 • LINEヤフーで機械学習エンジニア ◦

    近況: LLMのR&D • NeurIPS 2022, 2023 論文読み会に続き3回目 • NeurIPS 2024に現地参加 (プロフィールHP) 2
  2. NeurIPS 2024概要
 • 機械学習のトップ国際会議 • カナダのバンクーバーで開催 • ↓ 2024年の頻出キーワード 1

    Large Language Models 2 Reinforcement Learning 3 Diffusion Models 4 Graph Neural Networks 5 Transformer https://papercopilot.com/paper-list/neurips-paper-list/neurips- 2024-paper-list/ 3
  3. Q. なぜ現地参加 A. 論文採択
 Stepwise Alignment for Constrained Language Model

    Policy Optimization https://openreview.net/forum?id=VrVx83BkQX 6
  4. 解きたければ解けばよかろう → 煩雑で不安定 [Safe RLHF] 発表した論文: SACPOについて(3)
 Safe RLHFの手順: (1)

    有用性と安全性を評価する関数を教師あり学習 (2) これを最大化するようにLLMを強化学習 → 従来のRLHFの問題を引き継ぐ Safe RLHF: Safe Reinforcement Learning from Human Feedback https://arxiv.org/abs/2310.12773 9
  5. LLMの追加学習はせず,推論時にトークン生成確率を操作 論文「Ctrl-G」について(3)
 16 • 計算したい確率 : 生成済みトークン列x<tと制約αに条件付けられた LLMによるトークンx_tの生成確率 • 通常のLLMで計算できる確率

    : 生成済みトークン列x<tに条件付けら れたLLMによるトークンx_tの生成確率 • 非自明な確率 : x<tとx_tから生成を続けて最終的に制約αを充足する 確率
  6. 論文「Ctrl-G」について(4)
 17 Adaptable Logical Control for Large Language Models https://arxiv.org/abs/2406.13892

    LLMをHMMで近似 & 正規表現を DFAで表現 → Forwardアルゴリズムを活用して右辺を計算する