Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
claude codeでPrompt Engineering
Search
いおりん
July 22, 2025
Technology
0
190
claude codeでPrompt Engineering
いおりん
July 22, 2025
Tweet
Share
Other Decks in Technology
See All in Technology
Maintainer Meetupで「生の声」を聞く ~講演だけじゃないKubeCon
logica0419
0
140
サービスを止めるな! DDoS攻撃へのスマートな備えと最前線の事例
coconala_engineer
1
210
RapidPen: AIエージェントによる高度なペネトレーションテスト自動化の研究開発
laysakura
1
340
Bliki (ja), and the Cathedral, and the Bazaar
koic
6
840
MCP とマネージド PaaS で実現する大規模 AI アプリケーションの高速開発
nahokoxxx
1
1.2k
セキュアなAI活用のためのLiteLLMの可能性
tk3fftk
1
540
室長の逆襲 :データ活用の陣地を増やすためのヒント
masatoshi0205
0
150
[SRE NEXT 2025] すみずみまで暖かく照らすあなたの太陽でありたい
carnappopper
2
810
M365アカウント侵害時の初動対応
lhazy
5
3.3k
Microsoft Defender XDRで疲弊しないためのインシデント対応
sophiakunii
3
380
ObsidianをLLM時代のナレッジベースに! クリッピング→Markdown→CLI連携の実践
srvhat09
7
8k
スプリントゴール未達症候群に送る処方箋
kakehashi
PRO
1
160
Featured
See All Featured
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.8k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
108
19k
Side Projects
sachag
455
43k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
GitHub's CSS Performance
jonrohan
1031
460k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Statistics for Hackers
jakevdp
799
220k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
The Invisible Side of Design
smashingmag
301
51k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
Transcript
claude codeで Prompt Engineering 2025/07/22
自己紹介 ・名前:いおりん (https://x.com/Ioriiii8) ・職務内容: ・土木図面のチェックシステム ・学校教育の自動採点システム についてLLMを用いて取り組んでいます ・趣味:マグロ釣ってます。
今日話したいこと コーディング以外でのclaude codeの活用方法 プロンプトの評価・改善フィードバックループの事例を共有
claude codeの魅力 MAXプランによる定額使い放題 -> 雑に検証を回したり、並列実装を安易に行える 高い自立性とロングラン能力 -> tool等を大量に使う長時間タスクを実行できる ex) コードベースに関連する論文を大量に検索してMarkdownで保存
プロンプトエンジニアリングは大変 めんどくさいし 品質管理が大変!! ⭐寝てる間にいい感じにやってほしいというモチベーション ⭐
フィードバックループのワークフロー データセット:Trainデータ、Valiデータ、Testデータの3種類を準備 LLM実行スクリプト:claude codeが実行するためのスクリプトの準備 - 出力結果を整形してclaude codeに食わせやすい形にすることが肝要 品質評価:LLMの出力がどうあってほしいかの観点を整理
プロンプトの評価・改善手法 Opus4自体の推論によるLLM as a judge Anthropic のimprove_prompt API(https://docs.anthropic.com/en/api/prompt-tools-improve) 論文やLLMモデルのベスプラなどを参照(ragでもいい)
ロングランタスクのヒント ファイルの読み書き、スクリプトの実行はTaskツールを使う -> メインエージェントのコンテキスト節約を徹底 詳細なTodoリストのテンプレ、作業記録のテンプレ作成 -> 毎回のclaude codeの挙動を制御 定性評価の定量化 ->
実行ごとの評価を相対化する
おわりに 寝てる間にたくさん走ってくれてるとうれしい!