Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RapidPen: AIエージェントによるペネトレーションテスト 初期侵入全自動化の研究
Search
Sho Nakatani
March 11, 2025
Research
0
14
RapidPen: AIエージェントによるペネトレーションテスト 初期侵入全自動化の研究
RapidPenの2025/03時点の研究開発紹介
Sho Nakatani
March 11, 2025
Tweet
Share
More Decks by Sho Nakatani
See All by Sho Nakatani
ソフトウェア研究における脅威モデリング
laysakura
0
1.8k
Other Decks in Research
See All in Research
大規模言語モデルを用いたニュースデータのセンチメント判定モデルの開発および実体経済センチメントインデックスの構成
nomamist
1
140
「熊本県内バス・電車無料デー」の振り返りとその後の展開@土木計画学SS:成功失敗事例に学ぶ公共交通運賃設定
trafficbrain
0
240
20250226 NLP colloquium: "SoftMatcha: 10億単語規模コーパス検索のための柔らかくも高速なパターンマッチャー"
de9uch1
0
140
知識強化言語モデルLUKE @ LUKEミートアップ
ikuyamada
0
280
Weekly AI Agents News! 11月号 論文のアーカイブ
masatoto
0
300
Whoisの闇
hirachan
3
320
言語モデルの内部機序:解析と解釈
eumesy
PRO
21
6.6k
Gemini と Looker で営業DX をドライブする / Driving Sales DX with Gemini and Looker
sansan_randd
0
150
複数データセットを用いた動作認識
yuyay
0
130
メールからの名刺情報抽出におけるLLM活用 / Use of LLM in extracting business card information from e-mails
sansan_randd
2
440
非ガウス性と非線形性に基づく統計的因果探索
sshimizu2006
0
570
リモートワークにおけるパッシブ疲労
matsumoto_r
PRO
6
5k
Featured
See All Featured
How GitHub (no longer) Works
holman
314
140k
GitHub's CSS Performance
jonrohan
1030
460k
The Language of Interfaces
destraynor
156
24k
Visualization
eitanlees
146
15k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.3k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
11
1.3k
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.7k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
12k
Six Lessons from altMBA
skipperchong
27
3.6k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
49k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
7.1k
Transcript
RapidPen: AIエージェントによるペネトレーションテスト 初期侵入全自動化の研究 Security & Development Lab 中谷 翔 (@laysakura)
背景 ペネトレーションテスト
貢献 やったこと・新規性 • ペネトレーションテスト自動化ツールRapidPenを開発 ◦ AIエージェントによる創造性 ◦ オフェンシブセキュリティ専門知の活用による職人芸 • 新規性
◦ 高速な完全自動初期侵入 (IP-to-Shell) ▪ 人間の介在を排する強力なタスク計画と実行
ユースケース 先行研究と本研究の比較 ターゲットユーザー プロのペンテスター (支援) ペンテスト知識ない開発者 (委託) プロのペンテスター (支援・委託)
手法 AIエージェントで全自動化
手法 AIエージェントで全自動化
先行研究 との比較・差分 (1/2)
先行研究 との比較・差分 (2/2)
評価 HackTheBox Legacyマシンへの初期侵入 (内訳気にせずOK) 6回成功/10試行 実行時間 200~400秒程度で侵入成功 コスト ($) 0.6$
弱で侵入成功
今後の課題
発表 したもの 何・リンク QRコード 本スライド デモ動画 (HTB Legacyマシンに 初期侵入する経過・結果) 論文
(arXivプレプリント) 何・リンク QRコード Webサイト (RapidPenの紹介・ニュース) OSS: wish (RapidPenのAct部分を 切り出して人間が使う ようにしたLLMシェル)
参考文献 [1] Deng, Gelei, et al. "PentestGPT: Evaluating and harnessing
large language models for automated penetration testing." 33rd USENIX Security Symposium (USENIX Security 24). 2024. [2] 高江洲 勲, 一ノ瀬 太樹, "BLADE:自律AIエージェントを活用したペ ネトレーションテスト自動化の試み," AVTOKYO 2024. [3] Yao, Shunyu, et al. "ReAct: Synergizing reasoning and acting in language models." arXiv preprint arXiv:2210.03629 (2022).
アンケートご回答お願いします!