Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
プロダクト成長を支える開発基盤とスケールに伴う課題
Search
yuu26
February 03, 2026
Technology
1.6k
4
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
プロダクト成長を支える開発基盤とスケールに伴う課題
yuu26
February 03, 2026
More Decks by yuu26
See All by yuu26
LLM 機能を支える Langfuse / ClickHouse のサーバレス化
yuu26
9
5.8k
Datadog 関数クイズ (初級編)
yuu26
0
160
バクラクにおける可観測性向上の取り組み
yuu26
4
2.4k
AWS アーキテクチャクイズ
yuu26
3
1.5k
EMになって半年でやったこと
yuu26
1
3.2k
ローカル開発環境をAWSへ移行して爆速にした
yuu26
15
11k
AWS Systems Manager で実現する SSH レスでセキュアなクラウド運用
yuu26
2
4.9k
Other Decks in Technology
See All in Technology
Kiroで書いた 設計書 が AI レビューの 採点基準 になる
ezaki
0
130
SONiCで構築・運用する生成AI向けパブリッククラウドネットワーク ~実装編~
sonic
0
280
iOS アプリの「これって不具合ですか?」を AI に調べてもらう
miichan
0
100
iAEONの段階的リアーキテクト戦略 / iAEON's_Gradual_Re-architecture_Strategy
aeonpeople
0
230
脱SaaS!FDEを支えるプロビジョニングと分離設計
knih
0
240
データサイエンスを価値につなげるプロジェクト設計 〜 DS一年目が現場で得た気づき 〜
ysd113
1
280
[チョークトーク資料]AWS DevOps Agent を使いこなす / AWS Dev Ops Agent Chalk Talk AWS Summit Japan 2026
kinunori
3
590
FPGAの開発コンペでZephyrを使ってみた
iotengineer22
0
150
コミュニティの有益性 ~JAWS Days 2026 での体験を通して~ / The Benefits of a Community ~Through My Experience at JAWS Days 2026~
seike460
PRO
0
190
2026TECHFRESH畢業分享會 - Lightning Talk - 打造精準高效的 MCP 設計模式與測試實務
line_developers_tw
PRO
0
1.3k
アンオフィシャルな、オフィシャルからのお願い
wyamazak_devrel
0
140
スタートアップにAmazon EKSは早すぎる? マルチプロダクト戦略を加速する Platform Engineeringの実践 / Is Amazon EKS Too Soon for Startups? Practical Platform Engineering to Accelerate a Multi-Product Strategy
elmodev09
1
400
Featured
See All Featured
Done Done
chrislema
186
16k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.2k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
2
220
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.8k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
55k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.5k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.5k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
860
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
250
Side Projects
sachag
455
43k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Transcript
プロダクト成長を支える開発基盤と スケールに伴う課題 2026-02-03 "しくじり"から学ぶ!急成⻑プロダクト「バクラク」 「Bill One」の裏側~技術編~
自己紹介 自己紹介 上原 佑介 インフラエンジニア → SRE 株式会社LayerX バクラク事業部 Platform
Engineering部 SREグループ AWS, Datadog, Terraform あたりをよく触る 趣味 旅行、飛行機 ゲームいろいろ © LayerX Inc. 2
今日話すこと © LayerX Inc. 今日話すこと プロダクト成長を支える開発基盤の仕組み 自動化が産んだスケールに伴う課題 (しくじり) 改善に向けた現在の取り組み AI
時代に向けた直近の対応 3
バクラクについて
バクラクについて © LayerX Inc. 5
バクラクの開発を支えるプラットフォーム © LayerX Inc. バクラクについて バクラクには layerone と呼ばれる開発プラットフォームがある サービス定義ファイルを軸とした自動生成の仕組みを持つ 基盤チームや
SRE に依存しないセルフサービス化 例: auth ドメインの token サービスを作る場合 サービス定義ファイルに以下の記述をする インフラ、アプリケーションコードのテンプレ、CI/CD、監視設定が自動生成される 6
バクラクの開発を支えるプラットフォーム バクラクについて Universal Binary によるコンテナイメージ集約 多くのマイクロサービスが含まれるシングルバイナリ 環境変数やコマンド引数で起動したいサービスを指定 ビルドの高速化とイメージ管理コストを削減 ローカル環境および本番環境で運用中 マイクロサービスは月に3つほど増加、現在120サービス超
9 プロダクトを SRE チーム 5 人で横断的に見れる状態に © LayerX Inc. 7
プロダクト成長に伴う課題
リリース作業における課題 © LayerX Inc. プロダクト成長に伴う課題 プロダクト特性もあり、定期的な機能リリースタイミングを設けている 100以上のサービスが短時間にデプロイされる 1サービス = 1
ECS Service の単位 GitHub Actions レートリミット AWS ECS API のスロットリングによる失敗 依存関係によるデプロイ順待ちも発生 定期リリースに数時間以上かかる状態に 9
運用面の課題 © LayerX Inc. プロダクト成長に伴う課題 リソースの上限や制約により自動生成に失敗 ALB ターゲットグループのアタッチ上限 100 共通リソースにおけるアクセスポリシーの文字数上限突破
監視設定・ユーザの拡大に伴うアラート発報増加 自動生成も含めて 3,000 件以上のアラートが存在 サービス特性に沿った監視の最適化が追いつかない ユーザ操作に伴うエラーログの流量増加 初期は機能していた仕組みがスケールに伴い合わなくなってきた 10
解決に向けた取り組み
デプロイ周りの改善 (着手中) © LayerX Inc. 解決に向けた取り組み 依存関係のないサービスを独立デプロイ可能に 一部サービスから始めて拡大中 定期リリースを待たずに出せる分は出す お客様への価値提供の高速化にもつながる
デプロイ単位の集約 1マイクロサービス = 1 ECS Service の形にこだわらない ドメイン単位やプロダクト単位でのデプロイ集約を検討 Universal Binary や ECS Managed Instance を活用したインフラ集約 デプロイ待ち・レートリミット等のリソース制約を回避 12
アラート増加への対応 (検討中) © LayerX Inc. 解決に向けた取り組み リソース使用率ではなくユーザ影響を軸にした監視へ移行 一律で自動生成するメトリクス監視をやめる 重要エンドポイントやリクエスト成功率・レイテンシに着目する ログ出力に関するポリシー決め
Datadog Error Tracking などの活用 緊急度に応じた Critical / Error / Warn などの使い分けを統一 必要なログのみを出力・監視することで、費用と運用コストを最適化 これまでの仕組みを一から見直し、監視ポリシーを再設計 13
今後の進化を支えるために
AI/LLM を組み込んだ機能開発が増加 © LayerX Inc. 今後の進化を支えるために 2025年7月に AI 申請レビュー 機能をリリース
申請作成時に LLM が内容をリアルタイムでレビュー 15
AI 時代のプロダクト開発を支える基盤 © LayerX Inc. 今後の進化を支えるために Temporal Workflow 分散ワークフローエンジンの Temporal
を導入 非同期処理の呼び出し、ロングタスクをプロダクトに組み込みやすく Langfuse LLM 機能の開発や検証を支える基盤として構築 LLM 実行結果のトレース、モデルごとの精度検証・比較などで活用されている 既存基盤の改善を行いつつ、今後に向けた取り組みも同時に進行中 16
さいごに
まとめ © LayerX Inc. まとめ 初期は機能していた仕組みが、スケールに伴い一部ボトルネックに 自動生成の仕組みを軸とした開発プラットフォーム リソースの上限制約や運用面の課題に直面 定期リリースに数時間かかる状態 さらなるスケールに備えた再設計のタイミングが来た
サービス数の増加に伴うリソース集約 デプロイサイクルやアラート基準の見直し 同時に、プロダクトの進化を止めないための対応 AI/LLM による非同期処理や可視化要求への備え 18
エンジニア積極採用中! We are hiring! SRE を含めた幅広い職種で募集中です! やれること・やりたいことが沢山あります 0→1、1→10 などフェーズの異なるプロダクトに関われます Open
Door 募集中 30分のカジュアル面談をどなたでも申し込めます LayerX や SRE について気になることがあればお気軽に! © LayerX Inc. 19