Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SSII2026 [OS2-3] 「気づいたら仕事が終わっている」体験を提供する LayerX...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
画像センシングシンポジウム
PRO
June 09, 2026
330
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
SSII2026 [OS2-3] 「気づいたら仕事が終わっている」体験を提供する LayerX バクラクの Ambient Agent の裏側
画像センシングシンポジウム
PRO
June 09, 2026
More Decks by 画像センシングシンポジウム
See All by 画像センシングシンポジウム
SSII2026 [SS1] 作業動画理解 〜基盤モデル時代の応用と課題〜
ssii
PRO
0
500
SSII2026 [SS2] CADにおけるAI分野の動向と製造業 への実適⽤
ssii
PRO
1
780
SSII2026 [TS2] 日本古典文化とAI ~ データセットからアプリケーションまで~
ssii
PRO
0
370
SSII2026 [PT1] アクセラレーテッド・コンピューティングが切り拓く知能の最前線 ~生成AIからエージェンティックAI、そしてフィジカルAIへの進化~
ssii
PRO
0
450
SSII2026 [PT2] 記号創発ロボティクスとフィジカルAIの展開 〜集合的予測符号化が繋ぐ言語と身体の時空間階層性〜
ssii
PRO
0
470
SSII2026 [OS1] 計算機インフラどうしてる?
ssii
PRO
0
280
SSII2026 [OS1-1] 機械学習のための計算基盤の開発
ssii
PRO
0
290
SSII2026 [OS1-2] 学術クラウド基盤mdx IIの 設計と運用
ssii
PRO
0
260
SSII2026 [OS1-3] 実験室自動化を目指した 計算機との試行錯誤
ssii
PRO
0
250
Featured
See All Featured
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
300
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
2
1.5k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4.1k
How to Ace a Technical Interview
jacobian
281
24k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
10k
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.3k
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
160
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
150
The World Runs on Bad Software
bkeepers
PRO
72
12k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.2k
Transcript
© LayerX Inc. 「気づいたら仕事が終わっている」体験を提供する LayerX バクラクの Ambient Agent の裏側 2026/06/11
SSII2026 株式会社LayerX Yuya Matsumura
© LayerX Inc. 2 バクラク事業部 AI‧機械学習部 部⻑ / 機械学習エンジニア 経歴
2018/03 京都⼤学⼤学院 情報学研究科 修⼠課程修了 画像を入れてね ⾃⼰紹介 松村 優也 ⼀⼈⽬データサイエンティストとして推薦システム開発チームの⽴ち上げなど 2018/04 ウォンテッドリー株式会社 ⼊社 退職後は機械学習領域の技術顧問に就任 AI-OCRなど機械学習技術を活⽤したプロダクト開発に広く従事 2022/10 株式会社LayerX ⼊社 バクラク事業部 その他、⼤学にて⾮常勤講師や スタートアップの技術⽀援等 Yuya Matsumura 共著者 @yu__ya4 現在はAI‧機械学習部 部⻑としてAI戦略の策定や、 AIエージェントプロダクトの新規⽴ち上げなどを担当
LayerX‧バクラクについて ABOUT
4 © LayerX Inc. LayerX の Mission
5 © LayerX Inc. LayerX が解決しようとしている課題 (※)2025年11⽉時点
6 © LayerX Inc. LayerX のバクラク事業
7 © LayerX Inc. バクラク事業 事業領域 (※)2025年11⽉時点
8 © LayerX Inc. LayerX のバクラク事業
バクラクAIエージェントが⽬指すもの 「気づいたら仕事が終わっている」体験を提供する Ambient Agent
© LayerX Inc. 10 バクラクAIエージェントが⽬指すもの バクラクは “業務の完全⾃動運転” を⽬指す
© LayerX Inc. 11 バクラクAIエージェントが⽬指すもの たとえば、出張予定をカレンダーに登録すると出張に伴う業務が完了している 「気づいたら仕事が終わっている」体験 出張予定が カレンダーに登録 バクラク
Aエージェント 出張内容をもとに 事前の出張申請を作成 ユーザー 確認 業務の遂⾏ 承認 トリガー 社内規定に沿った 交通⼿段や宿泊施設を⼿配 出張期間中の経費精算など 事後の申請を作成
© LayerX Inc. 12 バクラクAIエージェントが⽬指すもの 仕事の主体はあくまで⼈間 従来のチャット起点の汎⽤Agentの限界 チャットで 依頼 ⼈間
エージェント が実⾏ 汎⽤AIエージェント 仕事完了 汎⽤Agent 仕事が始まらない‧並列数が増えない‧効果的に頼めない あらゆる業務のコンテキストをひとつのAgentに詰め込むのは⾮効率であり、性能にも影響あり
© LayerX Inc. 13 バクラクAIエージェントが⽬指すもの 業務ごとに特化したAIエージェントが主体となり、⾃律的に仕事が完了している。 バクラクが⽬指す Ambient Agent ⼈間
メール通知 フィードバックを もとに精度向上 出張⼿続きが⾃動で完了 承認作業が⾃動で完了 請求書処理が⾃動で完了 スケジュール登録 業務の⾃動化 サイクル イベント検知 仕事完了 領収書アップロード 業務ごとに特化した AIエージェント 必要に応じて ⼈に確認 ⾃律的に判断‧実⾏ 確認‧修正‧承認 Ambient Agent
バクラクAIエージェント事例 「気づいたら仕事が終わっている」体験を提供する Ambient Agent の実例
© LayerX Inc. 15 メールの内容からURLやパスワードなどを取得し、⾃動で証憑を取得してデータ化 証憑取得エージェント
© LayerX Inc. 16 バクラクAIエージェント事例 ⾃動分割 ⾃動分割 申請作成エージェント 読み取った証憑データやカードの明細情報、過去の申請情報などから申請を⾃動作成
© LayerX Inc. 17 社内規定や過去の申請差し戻し履歴から学んだ企業ごとの申請ルールに基づき、申請内容を⾃動レビュー 申請レビューエージェント
© LayerX Inc. 18 申請内容や過去データに基づき仕訳を⾃動作成し、内容チェックまで実施 仕訳エージェント
© LayerX Inc. 19 業務に必要な軸でコストを可視化‧分析し、コスト削減施策まで提案 コスト分析エージェント
どこまでをAIエージェントに任せるか? できるだけ⼤きく任せる:申請レビューエージェント開発‧運⽤からの学び
© LayerX Inc. 21 最初からできるだけ業務全体を AIエージェントに任せる/⾃動化することを⽬指す どこまでをAIエージェントに任せるか? 問題を⼩さく分解し、優先度をつけ、着実にひとつずつ解決していく従来の⽅法とは異なるアプローチ
© LayerX Inc. 22 バクラク申請レビューエージェントの開発‧運⽤を通した学び 部分の⾃動化から、全体を任せる⽅針への転換が進んでいる どこまでをAIエージェントに任せるか? 開発当初(1年半前) タスク‧情報を細かく分割して構築 運⽤開始
顧客‧ルールが増加 運⽤課題の発⽣ 管理コスト増‧柔軟性喪失 転換(現在) まるっとAIに任せる⽅向へ 開発当初は、AIによる不確実性をできるだけ⼩さくする意図で、タスクを細かく分割した上で必要と思われる情報に絞って AIエージェントに与えていた。 運⽤を開始し、顧客や対応するレビュールールが増えるにつれ、管理コストや柔軟性の課題が⽣じた。 分割せずにまるっとタスクや申請の内容など関連情報をAIエージェントに渡してみたら、解けた。性能向上した部分も。
© LayerX Inc. 23 なぜ最初から全体の⾃動化を⽬指すべきか ②部分のみへの注⽬は コンテキスト不⾜を招く どこまでをAIエージェントに任せるか? ①LLMは想像している よりも賢い
③そもそも⽬指すべきは 全体の⾃動化
© LayerX Inc. 24 どこまでをAIエージェントに任せるか? ①LLMは想像しているよりも賢い 従来の機械学習:「⼩さく切り分ける」が原則 • E2Eで解こうとしても性能が出ない •
莫⼤な学習データが必要 • ブラックボックス化し、改善が回しづらい → 「細かく分割」は合理的な意思決定であった ⼤LLM‧Agent時代:前提が変わった • フラグシップモデルは、必要なコンテキストさ え渡せば思っているよりできてしまう • 今できなくても、近い将来できるようになる可 能性が⼗分にある → 分割の前提となっていた技術的制約から解放 Claude Codeもリリース当時は厳しい声も多かったが、今やなくてはならない存在 モデルの進化により「将来できるようになる」前提でbetして作るのも、⼗分に合理的ではないか
© LayerX Inc. 25 どこまでをAIエージェントに任せるか? ②部分のみへの注⽬はコンテキスト不⾜を招く ⼀部の項⽬だけでは判定できない。プロセス全体を⾒渡したコンテキストが必要。 これは「妥当」な内容か? 申請の全体‧添付ファイル 事前申請の内容
上⻑とのやりとり 商談ガイドブック
© LayerX Inc. 26 どこまでをAIエージェントに任せるか? ③そもそも⽬指すべきは全体の⾃動化 ⼤LLM‧Agent時代、全体を⾃動化する体験がどんどん出てくるであろう。 部分の⾃動化で満⾜していては勝てない。 「気づいたら仕事が終わっている」体験は ⼀部だけの⾃動化からは⽣まれない
© LayerX Inc. 27 どこまでをAIエージェントに任せるか? そもそも「100%の精度を求めないといけない」という前提を疑ってみる 間違うことのあるAIに仕事を任せられない? • LLMの性能向上により、⼈間の⽅が間違う分野も増 えている
• まずAIにまるっと任せて、⼈間が確認側に回るのは 妥当ではないか ユーザーのメンタルモデルも変化 • 「AIだから多少間違うのは当然」を前提に利⽤する 考えが普及しつつある • 学習して賢くなるだろう、という期待さえある • ⽢えてばかりではいけないが、今はある意味「ボー ナスタイム」ではないか そもそも、⼈間も間違う
© LayerX Inc. 28 どこまでをAIエージェントに任せるか? まずは⼀部のユースケースの「全体を⾃動化すること」から始める その時点の最⾼のモデルで、全体の⾃動化を試みる どうしても難しい部分を、分解する‧切り出す 最初に取り組むユースケースは「反復的で、定期的に発⽣するタスク」がオススメ ほぼ同じだが、少し違う
コピペでは済まないが、コンテキス トを渡せば完全に⾃動化できる可能 性が⾼い 件数が多い 参考にできる情報が多い ⾃動化の効果が⼤きい 定期的に発⽣する 改善ループが回しやすい 例:毎⽉発⽣する交通費の精算
AI-BPOによる全体の⾃動化の実現 Human-in-the-Loop から Human-on-the-Loop へ
© LayerX Inc. 30 AI-BPOによる全体の⾃動化の実現 Human-in-the-Loop から、Human-on-the-Loop へ HITL(Human-in-the-Loop) •
仕事の⼀部を⼈間が代わりに実施する / 途中の⾏動 ‧成果物を⼈間が承認する • ただし、プロセスの中に⼈間を何度も⼊れると、⼈ 間がボトルネックに • 細かく確認していては、全体を任せた意味が薄れる HOTL(Human-on-the-Loop) • エージェントがゴールに向けてループを回す • ⼈間はループの外側で、⽬的‧制約‧品質基準 ‧検証を設計する • 中の挙動には細かく介在しない
© LayerX Inc. 31 AI-BPOによる全体の⾃動化の実現 AI-BPO: 安⼼して実現できる Human-on-the-Loop の形 仕事を丸投げ
AI-BPO AIエージェント × ⼈間オペレーター 最終確認 ユーザー⽬線の「勝⼿に仕事が終わっている」体験を、⼈間オペレーターとともに実現 ユーザー(顧客) 仕事の完了
© LayerX Inc. 32 AI-BPOによる全体の⾃動化の実現 AI-BPO: AI Agent with Human
(≠ Human with AI Agent) https://bakuraku.jp/news/20260130/
© LayerX Inc. 33 AI-BPOによる全体の⾃動化の実現 AI-BPOのメリット ① 難しい仕事も受けられる 現時点のLLMで⾃動化が難しいもので も、まるっと受けることができる。LLM
の性能が追いついた時点で⾃動化を進 める。⾃動化の精度が上がるほど、コ ストが下がる構造を作り上げられる。 ② リリース前の実験場になる まずはAI-BPOで仕事を受け、データや 業務ナレッジを蓄積する。AI-BPO内で の活⽤で性能が出たAIエージェントを随 時プロダクトへリリースする好循環を 作り上げられる。 ③ 業務理解獲得の最強の場 実際にどう業務を進めているのか、ど んなコンテキストが必要なのか。やっ てみないと⾒えないものが⾒える。 参考: 当社PMの実践例『7,800⾏の明細を承認して考える、AI-BPO with SaaS の可能性』 https://note.com/applism_118/n/nff2a7f97c3a2
「使えば使うほど賢くなる」AIエージェント フィードバック → 改善 → テスト → リリースのループを作り上げる
© LayerX Inc. 35 「使えば使うほど賢くなる」AIエージェント フィードバックをもとに、AIエージェントが(⾃動で)賢くなる改善ループを作れるか 「使えば使うほど賢くなる」AIエージェント ⼈間 フィードバックを もとに精度向上
業務の⾃動化 サイクル 業務ごとに特化した AIエージェント 必要に応じて ⼈に確認 ⾃律的に判断‧実⾏ 確認‧修正‧承認 フィードバックの収集 ユーザー / オペレーター / AI⾃⾝ 改善 プロンプト‧ナレッジ ‧Workflowなどの更新 テスト 安⼼して変更する リリース そして次のループへ
© LayerX Inc. 36 「使えば使うほど賢くなる」AIエージェント フィードバックの収集 ⼈間からのフィードバック プロダクト上でユーザーから(体験を 阻害しない形で収集)/ BPOオペレー
ターから Langfuseなどを利⽤して蓄積 モニタリングからのフィードバック プロダクト体験ごとに「性能」を定義 し、ダッシュボードを構築 モニタリングの中でフィードバックを 獲得 Snowflakeなどを利⽤して構築 AIによる⾃⼰分析 プロダクト上での失敗をもとに、 AIが⾃⾝で改善点を分析してフィード バックを⾏う
© LayerX Inc. 37 「使えば使うほど賢くなる」AIエージェント フィードバックにもとづいたAIエージェントの改善 フィードバックをもとに地道なデータ分析や追加のヒアリングなどを⾏い、モデルやプロンプト、メモリ ‧ナレッジ‧Workflowなどを改善する。 これからはAIエージェントの改善さえもAIエージェントに⾃動で実⾏させる時代 ⼈間をボトルネックにしない
Human-on-the-Loopの思想を、改善プロセス⾃体にも適⽤する 『AI Agent時代における「使えば使うほど賢くなるAI機能」の開発』 https://tech.layerx.co.jp/entry/2025/10/23/222742 『Software Design 2026年7⽉号: 実録 AIネイティブプロダクト開発 プロンプト最適化』 https://gihyo.jp/magazine/SD/archive/2026/202607
© LayerX Inc. 38 「使えば使うほど賢くなる」AIエージェント AIエージェントに直接指⽰を与えるのではなく、 AIエージェントの改善ループをデザインする https://x.com/steipete/status/2063697162748260627
© LayerX Inc. 39 「使えば使うほど賢くなる」AIエージェント 安⼼して変更するための、バックテストによる評価システム 『AI Agentのビジネス価値を計るバックテスト基盤の構築』 https://tech.layerx.co.jp/entry/2025/10/30/085410 『Software
Design 2026年6⽉号: 実録 AIネイティブプロダクト開発 AIエージェント時代の性能評価』 https://gihyo.jp/magazine/SD/archive/2026/202606 代表的なケースを集めた評価セットを⽤いて、 変更の効果‧副作⽤を定量的に確認 顧客環境でのバックテスト 顧客ごとの実過去データに対して、顧客の環境にお いて変更後のAgentの振る舞いを検証 評価データセットでのオフラインテスト 評価はできるだけE2Eで実施し、プロダクト体験を再現する
おわりに 結局、「やるべきこと」をやりきれるかがすべて
© LayerX Inc. 41 おわりに 当たり前を、やりきれるか 当たり前に聞こえることも多かったかもしれない。 ただ、それを「やりきれるか」は別の話。めちゃくちゃ泥臭く、めちゃくちゃ⼤変。 AIエージェントをユーザーに届けてフィードバックを獲得しつつ、 とにかく泥臭い運⽤‧改善を終わりなく回し続けることが、
完全⾃動化への⼀番の近道