診断AIエージェントによるセキュリティの未来 – 著名OSS向け0-dayリサーチを例に

© 2025 https://att.tech 診断AIエージェントによ6 セキュリティの未来著名OSS向け0-dayリサーチを例に Deep Security Conference 202h
取締役CTO 米内貴志 @lmt_swallow

© 2025 GMO Flatt Security Inc. All Rights Reserved. 前置き①
取締役CTO 米内貴志 2019年株式会社Flatt Securityに入社。2021年6月にCTOに就任し、以後同社にて製品セキュリティに関するソリューションの研究開発を牽引するサイバーセキュリティ国際会議「CODE BLUE 2024」レビューボード、サイバーセキュリティ競技「International Cybersecurity Challenge 2023」アジア代表チームキャプテン等を歴任著書に『Webブラウザセキュリティ ― Webアプリケーションの安全性を支える仕組みを整理する』（2021年、ラムダノート社）等。

エンジニアの背中を預かるより多くのエンジニアがものづくりに集中できる社会を、セキュリティ面からつくる会社

© 2025 GMO Flatt Security Inc. All Rights Reserved. 前置き②
― AIエージェントといっしょにに貢献世界の安全 CVE-2025-29768 potential data loss with zip.vim and special crafted zip hles in Vim < v9.1.1198 vim/vim CVE-2025-30218 x-middleware-subrequest-id may be leaked to external hosto vercel/next.js CVE-2025-31483 Stored XSS in Mini©ux Media Proxy due to improper Content-Security- Policy conhguration miniµux/v2 CVE-2025-32391 XSS possibility through malicious SVG uploads hedgedoc/hedgedoc 修正中 × 6 ▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓ ▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓ ▓▓▓▓ ▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓ ▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓ …

© 2025 GMO Flatt Security Inc. All Rights Reserved. 前置き③
― AIエージェントといっしょにに貢献お客様の安全 ※ もちろん、AI使用に関しては、お客様との種々のご調整の上で 14k ポスト 3~6月 3~6月 2k レポート Takumi byGMO を活用診断/ペンテストでも、自社AIエージェント

© 2025 GMO Flatt Security Inc. All Rights Reserved. リスク
= × インパクト H の増加9 の先の悲観的未来発生確率発生確率ノイズレート低下このへんでゲームの構造が変わる可能性がある。GMO Flatt Security は、先手を打つべく R&D している今日はまず| この未来予想に向いながら喋ります

© 2025 GMO Flatt Security Inc. All Rights Reserved. 本セッションの流れ
Chapter 01 AI-Assisted Hacking 時代へ Chapter 02 次の時代に向けた壁 Chapter 03 壁の先の未来 Chapter 04 未来に備えて現状分析から出発し、我々に必要な備えを考察していきます

© 2025 https://att.tech Chapter 1 AI-Assisted Hacking 時代へ GMO Flatt
Security の現在地点

© 2025 GMO Flatt Security Inc. All Rights Reserved. 振り返り:
Sonnet 3.7 以後の Coding Agent モデルの行動選択力が著しく向上例: Claude Code はほぼプリミティブツールのq Bash, Edit, View, GlobTool, GrepTool £ 所謂 ReAct など、元々 LLM に次の行動を選択させる取り組み自体は、2022年頃には既に結構行われていz £ コンテキスト長の制限や、モデル自体の性能にも引っ張られ、実用からは遠い時期が続いていたように思う £ 一方、Sonnet 3.7 頃から特に、モデル + プリミティブな Tool/Function で、妥当な行動が選択できるようI £ 生成コードの妥当さではなく、Tool Use の妥当さが増したのが、近年の Coding Agent の成長レバーといえる

© 2025 GMO Flatt Security Inc. All Rights Reserved. 脆弱性を探す
文脈を汲んで読むのコアスキルであるP も向上したということ

© 2025 GMO Flatt Security Inc. All Rights Reserved. AI
Agent (Takumi) が可能にしたこと脆弱性をクイックに探す、が出来るように n 初めて見るコードベースに対して、怪しいものを探す、あちこち見て回る、は著しく素早くでき n 色々チューンした結果、Takumi は他製品比でも人間的なイシューを見つけてくるように弊社ベンチマーク: Recall = TP/(TP + FN)

© 2025 GMO Flatt Security Inc. All Rights Reserved. Takumi
の能力検証 ― セキュリティ機構の削除本来あるセキュリティチェックを削除割とこういうのも拾える

© 2025 GMO Flatt Security Inc. All Rights Reserved. Takumi
の能力検証 ― データフローを踏まえたリスク判断データフローを加味して、リスクが低いと判断この例はシンプルだが、一般に、従来 SAST で出来ない判断が可能に

© 2025 GMO Flatt Security Inc. All Rights Reserved. 14k
メッセージ 3~6月 3~6月 2k レポートお客様システムの診断/ペンテストでa アシスタントとして Takumi を活用していG GMO Flatt Security with AI！結果としg 社内の利活用は著しく進んだ

© 2025 GMO Flatt Security Inc. All Rights Reserved. GMO
Flatt Security は “Hacking By Experts” “Hacking By Experts, with AI” かp へ変化してきた

Flatt Security Takumi/AI with 契約上の整理＆お客様へのご説明の上、 Takumi を可能な限りの診断PJに投入u ホワイトボックスベースで、診断初動や、診断中の細かな検証を任せるようp 少なくとも強い人が更に強くなった社内は Takumi の利用がデフォ弊社エキスパートが更に強く

© 2025 GMO Flatt Security Inc. All Rights Reserved. Vibe
Hacking への波 XBOW Hacktron Stealthnet 海外スタートアップも徐々に登場こぞって脆弱性発見 / Bug Hunting Platform での実績を競い合うように

© 2025 GMO Flatt Security Inc. All Rights Reserved. 実例:
HackerOne では AI が一部で一位（XBOW） k 世界有数のバグハンティングプラットフォームHackerOno k Vulnerability Disclosure Program（VDP）カテゴリでは XBOW が人を抜いて一位を記録していs k 単なる報告窓口にとどまらず、報奨金も伴う Bug Bounty Program（Bug Bounty Program）カテゴリに比べれば競争は穏やかだが、それでもすごい総量も結構見つけている毎月見つけている

© 2025 GMO Flatt Security Inc. All Rights Reserved. Vibe
Hacking 時代が近づいたように見え) … が、まだ、重要な壁がある

© 2025 GMO Flatt Security Inc. All Rights Reserved. その壁とは？
A. ノイズレートの壁 z False positive や、Trivial な True positive（それリスクにつながる？というようなもの）はまだまだ出g z Takumi は Cline 差 22.9% ほどまでこぎ着けたが、それでも 61.4% ほどが FP か Trivial な TP 弊社ベンチマーク: Weighted Noise Rate = (FP + βTPt)/(FP + βTPt +TPs), β=2

© 2025 GMO Flatt Security Inc. All Rights Reserved. 弊社ベンチマーク:
Weighted Noise Rate = (FP + βTPt)/(FP + βTPt +TPs), β=2 ノイズがこの水準だt 新脆弱性の完全自律量産はきびしい

© 2025 GMO Flatt Security Inc. All Rights Reserved. 嫌な方向に倒れることも
curl への AI 製の粗悪な脆弱性報告が過去問題に “We now ban every reporter INSTANTLY who submits reports we deem AI slop. A threshold has been reached. We are ehectively being DDoSed. If we could, we would charge them for this waste of our time.” “AI生成の粗悪なレポートを提出する報告者は、今後すべて即座にBANする。閾値はすでに超えた。こちらは事実上 DDoS攻撃を受けているようなものだ。できることなら、この時間の浪費に料金を請求したい。” Daniel Stenberg, https://www.linkedin.com/feed/update/urn:li:activity:7324820893862363136 日本語は筆者訳

© 2025 GMO Flatt Security Inc. All Rights Reserved. 事例:
トリアージ千本ノック以前の OSS 脆弱性調査では、弊社リサーチャーが無限のトリアージ作業を実施しこのような苦しみを経て、Takumi リリースにこぎつけたので、製品は良くなっしかし、ノイズレートの重要性を体感する時間だった（繰り返したくはない）

Flatt Security Takumi/AI with 弊社内利用でもT トリアージはエキスパートがしっかり実施

Flatt Security はそれまで with AI を徹底P 無責任な by AI はしない＆by AI 時代を抜けるためのR&Dにフルベット “With AI” “By AI” からへの壁はノイズレート” にある

© 2025 https://att.tech Chapter 3 壁の先の未来 Vibe Hacking 時代を迎えてしまったら ―
思考実験

© 2025 GMO Flatt Security Inc. All Rights Reserved. ノイズレートの壁が
脆弱性発見のスケーラビリティをせきとめている

© 2025 GMO Flatt Security Inc. All Rights Reserved. ノイズレートの壁
― なぜ重要？ほぼ検出コストほぼトリアージコスト脆弱性発見コスト ≒ AIコスト + 人間のコスト

― なぜ重要？ほぼ検出コスト高ノイズレートでは… ほぼトリアージコスト脆弱性発見コスト ≒ AIコスト + 人間のコストスケーさせられるスケーさせられない

― なぜ重要？結果としてスケーS させられない脆弱性発見コスト

© 2025 GMO Flatt Security Inc. All Rights Reserved. 前置き②
― AIエージェントといっしょにに貢献世界の安全 CVE-2025-29768 potential data loss with zip.vim and special crafted zip hles in Vim < v9.1.1198 vim/vim CVE-2025-30218 x-middleware-subrequest-id may be leaked to external hosto vercel/next.js CVE-2025-31483 Stored XSS in Mini©ux Media Proxy due to improper Content-Security- Policy conhguration miniµux/v2 CVE-2025-32391 XSS possibility through malicious SVG uploads hedgedoc/hedgedoc 修正中 × 6 ▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓ ▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓ ▓▓▓▓ ▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓ ▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓ … ここを増やしてないのò 低ノイズ化に向けた改善が必要と判断したから

= × インパクト H の増加9 の先の悲観的未来発生確率発生確率ノイズレート低下このへんでゲームの構造が変わる可能性がある。GMO Flatt Security は、先手を打つべく R&D している

= 発生確率 × インパクト G 発生確率の増加6 ノイズレート低下の先の悲観的未来このへんでゲームの構造が変わる可能性がある。GMO Flatt Security は、先手を打つべく R&D しているこの未来を避けるためには・・・

© 2025 GMO Flatt Security Inc. All Rights Reserved. [宣伝]
Takumi は商談無しでいつでも利用開始できます #1 AIで脆弱性診断g 低コストに自動化ソースコードの連携だけで、すぐに診断可能p ソースコードから依存パッケージの管理までo 7万円で、専門家レベルの診断をAIが実現します。 |1ヶ月のみ利用も可能 |商談不要 |今日から利用可能月額 7万円 (税抜) 月額 7万円 (税抜)

Takumi は商談無しでいつでも利用開始できます #2 1. GitHubと連携ソースコードの読み取ります 2. チャットで診断を指示 Slackでも利用可能 / 定期実行可能 3. AIが調査・レポートレポートの形式や修正は指示可能 GitHub App経由でソースコードを連携するだけで使用可能。Takumiは連携した情報をもとに診断を開始します。

Takumi は商談無しでいつでも利用開始できます #3 著名オープンソース製品に0-day 脆弱性を発見する実力 CVE-2025-29768 zip.vimにおける、巧妙に細工された ZIP ファイルによる潜在的なデータ損失の可能性 vim/vim CVE-2025-30218 x-middleware-subrequest-id が外部ホストに漏洩す可能性 vercel/next.js 10日間の実証実験で、Vim、Next.jsを始Ê 著名OSSを対象に10件の0-day脆弱性を発見他社AIよりも少ないノイズé 網羅的な検出が可能 ※2025年6月3日時点 Devin、Claude Code等の他のAI( 比較調査を行い、最も高い評価を記A ※ベンチマークレポートはこちらから従来の脆弱性診断サービスや他のAIと比較して高い脆弱性診断の性能を保持しています。

Takumi は商談無しでいつでも利用開始できます #4 公式サイト・デモデモの閲覧や詳細情報はこちらかf https://att.tech/takumi アカウント作成下記リンクからすぐに利用可能でm https://cloud.shisho.dev/hello/takumi お問い合わせ導入の際のご質問はこちらか https://att.tech/contact

© 2025 GMO Flatt Security Inc. All Rights Reserved. Our
Action #2 ― 攻撃者より先にノイズを潰す Graybox 手法を用いた発見のノイズ低減 ª 静的なコード検査での発見や学びを、実際のアプリケ環境を使った検証につなげ、多面的に評 ª Takumi の Blackbox エンジン（未公開）は、 PortSwigger Web Security Academy で、既に 269 問中 202 問（75%）を解いている（海外トップ競合 XBOW と同水準！e ª 手応えを感じつつおり、近日成果公表予定

エンジニアの背中を預かるより多くのエンジニアがものづくりに集中できる社会を、セキュリティ面からつくる会社

診断AIエージェントによるセキュリティの未来 – 著名OSS向け0-dayリサーチを例に

診断AIエージェントによるセキュリティの未来 – 著名OSS向け0-dayリサーチを例に

More Decks by GMO Flatt Security

Featured

Transcript