Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DeepRacer cup本戦 ~30秒の切り方~
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
chiaoi
December 23, 2025
26
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
DeepRacer cup本戦 ~30秒の切り方~
chiaoi
December 23, 2025
More Decks by chiaoi
See All by chiaoi
AWSを"安全に"始める
chiaoicchi
1
67
Neptune Analytics SSSP Δ-parameter
chiaoicchi
1
62
RAG入門
chiaoicchi
0
180
State machineはTurningの夢を見るか?
chiaoicchi
0
120
私なりのAIエージェントの理解と開発ツールの選び方
chiaoicchi
0
10
Fine-tuning Hands-on
chiaoicchi
0
16
kani
chiaoicchi
0
55
Trn3 UltraServer
chiaoicchi
0
27
Featured
See All Featured
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
Chasing Engaging Ingredients in Design
codingconduct
0
220
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
2
390
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
1
250
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.6k
Navigating Weather and Climate Data
rabernat
0
220
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
230
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.2k
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
840
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
Transcript
DeepRacer cup 本戦のコツ ~30秒の切り方~ chiaoi
自己紹介
結果 29.522 [s]
レースゲームのコツ 最速ライン を知ること
最速ライン 最速ライン を知ること → ドリフトをした方が速い? → インコースを着いた方が速い? → 大体直線だと思ってまっすぐ進んだ方が速い? →
車のスペックは?
自分なりの最速ライン 単調なコース - なるべく直線だと思っ て走りたい - 直線のうちは速度を なるべく上げたい
気づき ほとんど全てが 左 カーブ
左カーブを手厚く Action Space を ほとんど左カーブに
方針①:完走できるモデルから改良する 最初から速さを重視する → コースアウトが頻発する → 完走報酬を得る機会が少ない → 「完走」がいい行動として学習されない 完走することを重視する →
最初の学習で「完走」がいい行動として学べる → そこから改良していけば、「完走」をしながら 徐々 に速く改良できる Curriculum learning (Bengio et al., ICML 2009)
方針②:価値観の軸をぶらさない 継続学習で方針を変える → 学習済みの行動が否定される → 学習済みである意味がなくなる → 収束したときには学習済みである意味がなくなる → 方針を大きく変えるときは最初から学習したほうが良い
Proximal Policy Optimization Algorithms (Schulman et al. 2017)
方針③:なるべく直進 なるべく直進をしたい → 迷ったら直進を優先する → 小さなうねりや微妙な曲がりを「直線」と判定する → コースの先読みをして全体のコースの角度を判定し て 車体の向きがそれに沿うようにする
方針④:直線では最高速度を保つ 直線が多めのコース → 直線はスピードが出しやすいので最高速度をなるべ く 保ちたい
方針⑤:その他 完走ボーナス 目標ステップ
方針⑥:2回目の学習はさらに攻める - なるべく直進をさらに先のカーブまで把握する - カーブ強度で場合分けをして速度調整を細かく - 直線での報酬をさらに上げる - ステップ数をさらに短くする
方針⑦:カーブでは常に左を走ることを目標に 左カーブが多い → カーブでは常に左側にいる方がインを曲がれる
実装方法 これまでの方針を全てまとめて、 Claude に任せる
まとめ 実装自体は、LLMで可能になった。 → 実装をする前の「考察」の部分は、LLMよりも人間がやった方が良かった。 → 「考察」も、どのラインを走ったかを図示するコードや速度のグラフを表 示する コードなどを、LLMに作らせることで捗った。