Upgrade to Pro — share decks privately, control downloads, hide ads and more …

連合学習と機密コンピューティング

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

 連合学習と機密コンピューティング

JSAI2026 企画セッション「機密コンピューティングが切り拓く信頼できるAIの社会基盤」の登壇資料です。
https://pub.confit.atlas.jp/ja/event/jsai2026/presentation/2A5-KS-3-01

More Decks by LINEヤフーTech (LY Corporation Tech)

Other Decks in Technology

Transcript

  1. © LY Corporation 連合学習と 機密コンピューティング LINEヤフー研究所 松本 知優 / Tomoya

    Matsumoto 2026.06.09 JSAI2026 企画セッション「機密コンピューティングが切り拓く信頼できるAIの社会基盤」
  2. © LY Corporation 2 松本 知優 Tomoya Matsumoto Research Engineer

    大阪在住 略歴 2025/3 大阪大学大学院 情報科学研究科 修士課程修了 2025/4 LINEヤフー株式会社 入社 LINEヤフー研究所 Privacyディビジョン 専門 Privacy-Enhancing Technologies (PETs) • 差分プライバシー • 連合学習 • 機密コンピューティング • 合成データ Profile https://github.com/lycorp-jp/DPSQL_Plus Latest work
  3. © LY Corporation 4 Federated Learning(連合学習) • サーバーと多数のクライアントが協調する分散機械学習(Cross-device FL) •

    クライアントはローカルで実施した学習の更新情報だけをサーバーと共有する → 生データはクライアントに留まる、プライバシーに配慮 Global Model モデルを配布 重み差分を送信 ローカルで学習
  4. © LY Corporation 6 連合学習に残るリスク Global Model 更新情報から元のデータ を復元される恐れ 悪意あるサーバーが

    プロトコルを逸脱する恐れ サーバーと一部のクライ アントが結託する恐れ 処理の機密性や検証可能性に課題 → 機密コンピューティングで解決できるのでは?
  5. © LY Corporation どのくらいTEEに頼るか 9 TEE信頼レベル TEEの使用 差分プライバシー 学習場所 Lv.0

    不使用 ローカル クライアント Lv.1 使用(Shuffler) ローカル クライアント Lv.2 使用(サーバー全体) セントラル クライアント Lv.3 使用(サーバー全体) セントラル サーバー
  6. © LY Corporation 10 Lv.0 - ローカル差分プライバシー × 連合学習 •

    クライアントは各自のデータを用いて重み差分を計算・抑制し、自身でランダム化 • サーバーはランダム化された重みベクトル群の平均を算出し、グローバルモデルを更新 avg. Norm Clipping Random Sampling C Per-client Model difference Global Model Update 𝑥1 , … , 𝑥𝑏 ∈ 𝐷 △𝑖 = 𝜃𝑖 − 𝜃 Global Model 𝜃 + Perturbation + クライアント毎に送信回数を制限 サーバー クライアント ガウスノイズ ガウスノイズ
  7. © LY Corporation 11 Lv.1 - Privacy amplification via Shuffling

    • クライアントからの出力群をバッファして混ぜることで匿名化 • プライバシー増幅効果により、差分プライバシーを満たすために必要なノイズ量が低減 Shuffler privacy amp. via anonymization anonymous logs サーバー クライアント
  8. © LY Corporation 12 Lv.1 - TEEを用いたShufflingの実現 • サーバーとShufflerが結託すると、クライアントの匿名性が担保できない •

    LINEのスタンプ推薦では、ShufflerとしてIntel製のTEEを活用 TEE on Server TEE 管理者 Masking Shuffle records anonymous logs FLサーバ処理
  9. © LY Corporation 13 Lv.2 - セントラル差分プライバシー × 連合学習 •

    クライアントの重みベクトル群をサーバーで集約した後にランダム化 • ローカル差分プライバシーと比べて、必要なノイズ量が少ない • 実現には「信頼できる」サーバーが必要(機密性 + 検証可能性)→ TEEの出番 avg. C Global Model Update Global Model 𝜃 + サーバー クライアント ガウスノイズ
  10. © LY Corporation 14 DP-SGD系 ステートレスアルゴリズム Secure DP-FTRL • 状態を悪用したフォーク攻撃などを

    「TEE + クライアント監査」で防止 • 高い可用性と機密性を両立 関連研究 - ステートフルなFLアルゴリズム × TEE Securing Private Federated Learning in a Malicious Setting: A Scalable TEE-Based Approach with Client Auditing [Takagi+, PoPETs2026] https://arxiv.org/abs/2509.08709 DP-FTRL系 ステートフルアルゴリズム 状態を考慮した ノイズで高い有用性 大規模モデルに適用可 改ざんや 障害に弱い 複雑なサンプリング プロトコルが必要 シャッフリングに よる有用性の低下 提案手法
  11. © LY Corporation 15 Lv.3 - 連合学習の再定義 FLが直面する課題 FLの再定義 [Daly+,

    IEEE TPS 2024] https://arxiv.org/abs/2410.08892 大規模基盤モデルへの対応 LLMのような巨大モデルをモバイルデバイス 内で学習することは困難 サーバー側の検証可能性の欠如 サーバー側で集約処理が正しく行われている かを、第三者が検証する手段が乏しい システム運用上の複雑さ 多くの異種デバイスが同期して学習を行うFL システムは、開発運用に困難を伴う • クライアントが、自分のデータ・その データにアクセスできるプロセス・そ のプロセスの匿名化処理を完全に制御 • サーバはその制御と監査の手段を提供 これまで • データがローカルにあること これから Federated Learning in Practice: Reflections and Projections
  12. © LY Corporation 16 Lv.3 - Confidential Federated Computations [Daly+,

    IEEE TPS 2024] https://arxiv.org/abs/2410.08892 [Eichner+, 2024] https://arxiv.org/abs/2404.10764 TEEでホストされたサーバー側でデータを処理する