Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NIKKEI Tech Talk#38
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
cipepser
October 23, 2025
Programming
1.2k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
NIKKEI Tech Talk#38
cipepser
October 23, 2025
More Decks by cipepser
See All by cipepser
long-running-tasks
cipepser
3
500
layerx-fde-practices
cipepser
6
3.1k
LayerXにおけるFDEについて
cipepser
3
3.2k
20250725-bet-ai-day
cipepser
3
660
Criterion-rs
cipepser
0
170
Practical Anonify
cipepser
2
910
procedural-macros
cipepser
0
210
Move for Libra written in Rust
cipepser
2
3.3k
How IBLT Works
cipepser
0
270
Other Decks in Programming
See All in Programming
Signal Forms: Beyond the Basics @ngBaguette 2026 in Paris
manfredsteyer
PRO
0
250
ユニットテストの先へ:テスト技法で要求・仕様を整理するJava開発実践 / Beyond_Unit_Testing_Practical_Java_Development_Techniques_for_Organizing_Requirements_and_Specifications
shimashima35
0
400
New "Type" system on PicoRuby
pocke
1
920
例外の正しい扱い方 そのエラー try-catchして大丈夫?
jinwatanabe
0
230
代数的データ型って何が嬉しいの? #frontend_phpcon_do
kajitack
8
3.7k
dRuby over BLE
makicamel
2
340
AI時代の仕事技芸論 — ソフトウェア開発で「遊ぶように働く」職人的熟達のすすめ
kuranuki
2
670
脅威をエンジニアリングの糧にして――現場編 / Turning Threats into Engineering Fuel — Field Edition
nrslib
0
280
TAKTでAI駆動開発の品質を設計する
j5ik2o
6
1.3k
技術記事、AIに書かせるか、自分で書くか? 〜それでも私が自分の手で書く理由〜 / #QiitaConference
jnchito
2
1.4k
Oxlintのカスタムルールの現況
syumai
6
1.1k
net-httpのHTTP/2対応について
naruse
0
480
Featured
See All Featured
Design in an AI World
tapps
1
240
Testing 201, or: Great Expectations
jmmastey
46
8.2k
Designing Experiences People Love
moore
143
24k
Git: the NoSQL Database
bkeepers
PRO
432
67k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.5k
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
840
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
240
Code Reviewing Like a Champion
maltzj
528
40k
Exploring anti-patterns in Rails
aemeredith
3
410
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
140
Facilitating Awesome Meetings
lara
57
7k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Transcript
© LayerX Inc. 1 Forward Deployed Engineerが最速でドメインを キャッチアップするツールでのエージェント活⽤ 2025/10/23 NIKKEI
Tech Talk 株式会社LayerX Ai Workforce事業部 恩⽥壮恭
2 Confidential © 2025 LayerX Inc. 自己紹介 • 恩田壮恭(おんだまさのり) ◦
cipepser/cipe(さいぺ) • LayerX Ai Workforce事業部 • これまで ◦ 新卒で大手証券系SIerでネットワークエンジニア ◦ 暗号資産分野で新規事業立ち上げ ◦ TEEやPrivacyTechなど、技術を軸にした新規プロ ダクトの開発(LayerX歴5年半) • 現在 ◦ FDE(Forward Deployed Engineer)
© LayerX Inc. 3
4 Confidential © 2025 LayerX Inc. 出典: 3M. (2024). 3M
2023 Annual Report. U.S. Securities and Exchange Commission. https://www.sec.gov/Archives/edgar/data/66740/000130817924000309/mmm4298631-ars.pdf
5 Confidential © 2025 LayerX Inc. FDE = Forward Deployed
Engineer • 最前線(Forward)に配置された(Deployed)エンジニア • お客さまとの最前線に立ち、顧客課題を真に理解し、プロダクトの実装・導入を推進する エンジニア • Palantir曰く「スタートアップのCTOに似ている」 • 詳細は筆者が書いた以下ブログにて(魂込めてJD書きました) ◦ Forward Deployed Engineerの募集を開始しました - LayerX エンジニアブログ ◦ https://tech.layerx.co.jp/entry/ai-llm-fde (出典) Palantir Technologies - Forward Deployed Software Engineer https://jobs.lever.co/palantir/dab396d4-2f14-4796-aac0-0d82883dccf0
最前線で ドメインへディープダイブする
7 Confidential © 2025 LayerX Inc. ドメインを知らずして、価値は提供できない • お客さまはどういった業務をしている? ◦
実業務で扱うドキュメントをお預かりし、徹底的に読み解く ▪ 何がインプットで、何をアウトプットすべきか ▪ LLMで処理すべきか、ルールベースで処理すべきか ◦ マスターファイルの更新頻度は?古くなった資料も当時の証跡として残したい? • 関係するステークホルダーは? ◦ 関連会社、ベンダー、他部署からの入力資料 ▪ メールで来る?基幹システムから出力? ◦ 出力はどのようなステークホルダーに展開される?所定のフォーマットはある?
8 Confidential © 2025 LayerX Inc. 内製ツール「Onboard Lens」 デモをします
9 Confidential © 2025 LayerX Inc. エージェントをうまく動かすための工夫 品質保証‧予測可能性 エッジケースへの対応 •
決定論的な動作をするものはtoolとして定義 ◦ 何でもかんでもLLMにやらせない • toolの品質はソフトウェア工学の肩に乗る (CI/CDなど) • エージェントのプロンプトの作り込み • タスクリストを人間とエージェントの二人 で更新 • ファイルをメッセージからすぐ開いて確 認できるUI コンテキストエンジニアリング • 必要なコンテキストを検索して選択させるUI
なぜ、現在AIやLLM、エージェントは 我々の業務を代替してくれないのか
11 Confidential © 2025 LayerX Inc. クリアするために膨大なStep数が必要なベンチマーク 2025年8月 ポケモンクリスタル [3]
factorio [2] ポケモン⾚ [1] 2025年3月 2025年2月 [1] Claude's extended thinking \ Anthropic https://www.anthropic.com/news/visible-extended-thinking [2] Hopkins, Jack, Mart Bakler, and Akbir Khan. "Factorio learning environment." arXiv preprint arXiv:2503.09617 (2025). [3] Clad3815 - X https://x.com/Clad3815/status/1955980772575268897 GPT-5 Deepseek-v3, GPT-4-mini, LLaMA-70B, Gemini-2, GPT-4, Claude 3.5 Sonnet Claude 3.5,3.7 Sonnet レッドに勝利👏 (バッジ16個+ラストダンジョン) どのモデルでも複雑度5以上のリソースを 生成できる割合は0% 3.7 Sonnetがマチスに勝利 (バッジ3つ)
12 Confidential © 2025 LayerX Inc. どれだけのStep数をこなせるかは今後重要なKPIになりえる (出典) Measuring AI
Ability to Complete Long Tasks - METR https://metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks/
13 Confidential © 2025 LayerX Inc. Next Step • 多段Stepでエージェントを安定的に動かすためには「エンジニアリング」が必要
• 本質的に確率的な挙動を持つLLMを予測可能なコンポーネントに落とし込めるか ◦ CSやソフトウェア工学の問題に帰着できることも • 現実の業務に溢れているエッジケースへの対処 ◦ 個人的にはLLMが人間の業務を代替できていない主要因と考えている ◦ すべてのエッジケースをプロンプトに網羅的に記載するとLLMの出力が安定しない →動的に必要十分なコンテキストを渡す仕組み ◦ 本日のようにアプリケーションでカバーできる範囲の切り分け
© 2025 LayerX Inc. 14 FDEチーム • FDEはものすごくチャレンジングな職種 • ぶっちゃけ全部やり切るのすごく大変だし、
それを組織として作っていくのも難易度鬼高 いです • だからこそ一緒に働ける仲間を募集していま す!! R&Dチーム • FDE・Ai Workforceの可能性を10xにす るチームとしてR&Dチームが誕生! • 11月11日(火)にイベントやります! ◦ connpassからご登録ください We’re hiring