Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
[論文紹介] Chip Placement with Deep Reinforcement L...
Search
tt1717
April 29, 2024
Research
0
59
[論文紹介] Chip Placement with Deep Reinforcement Learning
PDFファイルをダウンロードすると,スライド内のリンクを見ることができます.
tt1717
April 29, 2024
Tweet
Share
More Decks by tt1717
See All by tt1717
[論文サーベイ] Survey on Minecraft AI in NeurIPS 2024
tt1717
0
42
[論文サーベイ] Survey on GPT for Games
tt1717
0
43
[論文サーベイ] Survey on World Models for Games
tt1717
0
73
[論文サーベイ] Survey on Linguistic Explanations in Deep Reinforcement Learning of Atari Tasks
tt1717
0
43
[論文サーベイ] Survey on Visualization in Deep Reinforcement Learning of Game Tasks 2
tt1717
0
46
[論文サーベイ] Survey on VLM and Reinforcement Learning in Game Tasks (Minecraft)
tt1717
0
78
[論文紹介] RT-1: Robotics Transformer for Real-World Control at Scale
tt1717
0
100
[論文紹介] Human-level control through deep reinforcement learning
tt1717
0
320
[論文紹介] Transformer-based World Models Are Happy With 100k Interactions
tt1717
0
130
Other Decks in Research
See All in Research
移動ビッグデータに基づく地理情報の埋め込みベクトル化
tam1110
0
270
言語モデルによるAI創薬の進展 / Advancements in AI-Driven Drug Discovery Using Language Models
tsurubee
1
260
アプリケーションから知るモデルマージ
maguro27
0
290
BtoB プロダクトにおけるインサイトマネジメントの必要性 現場ドリブンなカミナシがインサイトマネジメントに取り組むワケ / Why field-driven Kaminashi is working on insight management
kaminashi
1
360
SpectralMamba: Efficient Mamba for Hyperspectral Image Classification
satai
3
200
大規模日本語VLM Asagi-VLMにおける合成データセットの構築とモデル実装
kuehara
5
1.7k
CARMUI-NET:自動運転車遠隔監視のためのバーチャル都市プラットフォームにおける通信品質変動機能の開発と評価 / UBI85
yumulab
0
110
チュートリアル:Mamba, Vision Mamba (Vim)
hf149
6
3.2k
情報処理学会関西支部2024年度定期講演会「自然言語処理と大規模言語モデルの基礎」
ksudoh
10
2.7k
研究を支える拡張性の高い ワークフローツールの提案 / Proposal of highly expandable workflow tools to support research
linyows
0
360
PostgreSQLにおける分散トレーシングの現在 - 第50回PostgreSQLアンカンファレンス
seinoyu
0
290
20250226 NLP colloquium: "SoftMatcha: 10億単語規模コーパス検索のための柔らかくも高速なパターンマッチャー"
de9uch1
0
250
Featured
See All Featured
Done Done
chrislema
183
16k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.4k
Rebuilding a faster, lazier Slack
samanthasiow
80
8.9k
GraphQLとの向き合い方2022年版
quramy
45
14k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
30
2.3k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
12
1.4k
Reflections from 52 weeks, 52 projects
jeffersonlam
349
20k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
135
33k
We Have a Design System, Now What?
morganepeng
51
7.5k
Adopting Sorbet at Scale
ufuk
75
9.3k
What's in a price? How to price your products and services
michaelherold
245
12k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
7
610
Transcript
・チップの各コンポーネントを構成要素のグラフとして表現し,こ のグラフを効率的にチップのキャンバス上に配置する方策ネット ワークを訓練する. ・従来のチップ配置では多くが人間の専門家の介入を必要としてい た. ・提案した学習ベース手法では経験を積むことで性能が向上し,新 しいチップ配置を高速に生成できる. ・チップ配置を強化学習問題として扱う新たなアプローチを提案. ・提案手法では過去のチップ配置経験から学習し,未知のチップブ ロックに対して最適化された配置を高速に生成する能力があること
を示した. どんなもの? 先行研究と比べて何がすごい? 技術の手法や肝は? どうやって有効だと検証した? ・実際のAIアクセラレータチップ(Google TPUなど)に対して提案 手法を用いてチップ配置を行い,既存のベースライン(人間の専門 家の配置や他の自動配置ツール)と比較することで検証した. ・配置後のPPA(パワー,パフォーマンス,面積)の最適化を評価し た. Chip Placement with Deep Reinforcement Learning (arXiv 2020) Azalia Mirhoseini et al., Google Research. https://arxiv.org/abs/2004.10746 2024/04/28 論文を表す画像 被引用数:224 1/7
❖ 強化学習エージェントがマクロを一つずつ配置する様子を示す ❖ すべてのマクロ配置後,部品は力学的方法(力指向メソッド)を用い て配置される ➢ 力指向メソッド:互いに関連する部品は近くに配置され,関係のない部品 は離れた場所に配置されるようにすること ❖ 報酬はワイヤ長と輻輳の組み合わせで計算され,エージェントが次の
イテレーションでそのパラメータを最適化するために使用する ➢ ワイヤ長:チップの上で部品をつなぐワイヤの長さを推測する方法 ➢ 輻輳:あるエリア内に多くのワイヤが集中してしまう状態 提案手法 2/7
❖ 電子回路の構成要素 (ネットリスト) をGNNで処理 ❖ エッジ埋め込みの処理 ➢ ネットリスト内の異なるコンポーネント間の接続の強さや特性を表現 ❖ マクロ埋め込みの処理
➢ マクロ(大きな回路要素)の特性をベクトル形式で表現 ❖ 方策ネットワークによる処理 ➢ ネットリストの情報を基に,各マクロの配置における「行動」を選択する 提案手法 3/7
❖ CPUのチップ配置結果を視覚化したもの ➢ 左:事前学習済みの方策ネットワークによるゼロショット配置 ➢ 右:ファインチューニング後の方策ネットワークによる配置 ❖ ファインチューニング後の結果は配置が綺麗に揃っている 実験結果 4/7
❖ 強化学習とSA (焼きなまし法) によるサンプル効率の比較 ❖ ワイヤ長 (Wirelength) と輻輳 (Congestion)は低い方が良い ❖
強化学習を使用した提案手法がSAと比較して最適な配置をしていると 解釈できる 実験結果 5/7
❖ 強化学習を使用したチップ配置の最適化手法を提案した ❖ SA (焼きなまし法) と比較して最適配置を達成した まとめ 6/7
❖ チップにおける最適配置問題を強化学習で解こうとするアイデアが面 白かった ❖ 報酬設計の部分や実装コードがどのようになっているのか理解したい 感想 7/7