Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NIKKEI Tech Talk#38
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
cipepser
October 23, 2025
Programming
1.2k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
NIKKEI Tech Talk#38
cipepser
October 23, 2025
More Decks by cipepser
See All by cipepser
long-running-tasks
cipepser
3
500
layerx-fde-practices
cipepser
6
3.1k
LayerXにおけるFDEについて
cipepser
3
3.2k
20250725-bet-ai-day
cipepser
3
660
Criterion-rs
cipepser
0
170
Practical Anonify
cipepser
2
910
procedural-macros
cipepser
0
210
Move for Libra written in Rust
cipepser
2
3.3k
How IBLT Works
cipepser
0
270
Other Decks in Programming
See All in Programming
Observability in Practice:Grafana 與 Edge Device SRE 的那些事
blueswen
0
160
AIだと陥りがちなJakarta EE最新技術への移行時の落とし穴と解決策
tnagao7
0
110
正しくソフトウェアを作る、前提を疑うための認知の視点 / doubt-premise
minodriven
21
6.6k
エンジニアと一緒にテストコードの設計と実装を改善した話
mototakatsu
0
170
Webフレームワークの ベンチマークについて
yusukebe
0
170
dRuby over BLE
makicamel
2
340
IBM Bobを活用したレガシーアプリの最新化
oniak3ibm
PRO
1
200
ECSアプリログをFireLensでコスト削減しようとしたけど諦めた話 in Fargate×Node.js
akihisaikeda
2
4.2k
Language Server 使ってる? 〜VSCode と Zed の場合〜 / Are you using a Language Server? ~For VS Code and Zed~
handlename
0
780
「なぜそう決めたのか」を残し続ける仕組み ― Notion AI カスタムエージェント × Slack連携による設計判断の自動記録 - NIKKEI Tech Talk #47
niftycorp
PRO
0
170
DynamoDBには集計系のクエリがないけどなんとかしたい
musan
1
140
Vite+ Unified Toolchain for the Web
naokihaba
0
300
Featured
See All Featured
The browser strikes back
jonoalderson
0
1.2k
Producing Creativity
orderedlist
PRO
348
40k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.8k
Git: the NoSQL Database
bkeepers
PRO
432
67k
Facilitating Awesome Meetings
lara
57
7k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
460
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
It's Worth the Effort
3n
188
29k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
140
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.7k
Transcript
© LayerX Inc. 1 Forward Deployed Engineerが最速でドメインを キャッチアップするツールでのエージェント活⽤ 2025/10/23 NIKKEI
Tech Talk 株式会社LayerX Ai Workforce事業部 恩⽥壮恭
2 Confidential © 2025 LayerX Inc. 自己紹介 • 恩田壮恭(おんだまさのり) ◦
cipepser/cipe(さいぺ) • LayerX Ai Workforce事業部 • これまで ◦ 新卒で大手証券系SIerでネットワークエンジニア ◦ 暗号資産分野で新規事業立ち上げ ◦ TEEやPrivacyTechなど、技術を軸にした新規プロ ダクトの開発(LayerX歴5年半) • 現在 ◦ FDE(Forward Deployed Engineer)
© LayerX Inc. 3
4 Confidential © 2025 LayerX Inc. 出典: 3M. (2024). 3M
2023 Annual Report. U.S. Securities and Exchange Commission. https://www.sec.gov/Archives/edgar/data/66740/000130817924000309/mmm4298631-ars.pdf
5 Confidential © 2025 LayerX Inc. FDE = Forward Deployed
Engineer • 最前線(Forward)に配置された(Deployed)エンジニア • お客さまとの最前線に立ち、顧客課題を真に理解し、プロダクトの実装・導入を推進する エンジニア • Palantir曰く「スタートアップのCTOに似ている」 • 詳細は筆者が書いた以下ブログにて(魂込めてJD書きました) ◦ Forward Deployed Engineerの募集を開始しました - LayerX エンジニアブログ ◦ https://tech.layerx.co.jp/entry/ai-llm-fde (出典) Palantir Technologies - Forward Deployed Software Engineer https://jobs.lever.co/palantir/dab396d4-2f14-4796-aac0-0d82883dccf0
最前線で ドメインへディープダイブする
7 Confidential © 2025 LayerX Inc. ドメインを知らずして、価値は提供できない • お客さまはどういった業務をしている? ◦
実業務で扱うドキュメントをお預かりし、徹底的に読み解く ▪ 何がインプットで、何をアウトプットすべきか ▪ LLMで処理すべきか、ルールベースで処理すべきか ◦ マスターファイルの更新頻度は?古くなった資料も当時の証跡として残したい? • 関係するステークホルダーは? ◦ 関連会社、ベンダー、他部署からの入力資料 ▪ メールで来る?基幹システムから出力? ◦ 出力はどのようなステークホルダーに展開される?所定のフォーマットはある?
8 Confidential © 2025 LayerX Inc. 内製ツール「Onboard Lens」 デモをします
9 Confidential © 2025 LayerX Inc. エージェントをうまく動かすための工夫 品質保証‧予測可能性 エッジケースへの対応 •
決定論的な動作をするものはtoolとして定義 ◦ 何でもかんでもLLMにやらせない • toolの品質はソフトウェア工学の肩に乗る (CI/CDなど) • エージェントのプロンプトの作り込み • タスクリストを人間とエージェントの二人 で更新 • ファイルをメッセージからすぐ開いて確 認できるUI コンテキストエンジニアリング • 必要なコンテキストを検索して選択させるUI
なぜ、現在AIやLLM、エージェントは 我々の業務を代替してくれないのか
11 Confidential © 2025 LayerX Inc. クリアするために膨大なStep数が必要なベンチマーク 2025年8月 ポケモンクリスタル [3]
factorio [2] ポケモン⾚ [1] 2025年3月 2025年2月 [1] Claude's extended thinking \ Anthropic https://www.anthropic.com/news/visible-extended-thinking [2] Hopkins, Jack, Mart Bakler, and Akbir Khan. "Factorio learning environment." arXiv preprint arXiv:2503.09617 (2025). [3] Clad3815 - X https://x.com/Clad3815/status/1955980772575268897 GPT-5 Deepseek-v3, GPT-4-mini, LLaMA-70B, Gemini-2, GPT-4, Claude 3.5 Sonnet Claude 3.5,3.7 Sonnet レッドに勝利👏 (バッジ16個+ラストダンジョン) どのモデルでも複雑度5以上のリソースを 生成できる割合は0% 3.7 Sonnetがマチスに勝利 (バッジ3つ)
12 Confidential © 2025 LayerX Inc. どれだけのStep数をこなせるかは今後重要なKPIになりえる (出典) Measuring AI
Ability to Complete Long Tasks - METR https://metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks/
13 Confidential © 2025 LayerX Inc. Next Step • 多段Stepでエージェントを安定的に動かすためには「エンジニアリング」が必要
• 本質的に確率的な挙動を持つLLMを予測可能なコンポーネントに落とし込めるか ◦ CSやソフトウェア工学の問題に帰着できることも • 現実の業務に溢れているエッジケースへの対処 ◦ 個人的にはLLMが人間の業務を代替できていない主要因と考えている ◦ すべてのエッジケースをプロンプトに網羅的に記載するとLLMの出力が安定しない →動的に必要十分なコンテキストを渡す仕組み ◦ 本日のようにアプリケーションでカバーできる範囲の切り分け
© 2025 LayerX Inc. 14 FDEチーム • FDEはものすごくチャレンジングな職種 • ぶっちゃけ全部やり切るのすごく大変だし、
それを組織として作っていくのも難易度鬼高 いです • だからこそ一緒に働ける仲間を募集していま す!! R&Dチーム • FDE・Ai Workforceの可能性を10xにす るチームとしてR&Dチームが誕生! • 11月11日(火)にイベントやります! ◦ connpassからご登録ください We’re hiring