Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
IaaSにおけるPlatform Engineeringとこれから / Platform en...
Search
kazeburo
May 15, 2023
Technology
2
1.3k
IaaSにおけるPlatform Engineeringとこれから / Platform engineering in IaaS
IaaSにおけるPlatform Engineeringとこれから
Platform Engineering Meetup #2
2023/05/15
kazeburo
May 15, 2023
Tweet
Share
More Decks by kazeburo
See All by kazeburo
[さくらのTech Day] ガバメントクラウド開発と変化と成長する組織 / sakura techday, Develop govcloud and the team
kazeburo
0
13
ガバメントクラウド開発と変化と成長する組織 / Organizational change and growth in developing a government cloud
kazeburo
4
1.8k
DNS水責め攻撃と監視 / DNS water torture attack Monitoring and SLO
kazeburo
5
4k
DBやめてみた / DNS water torture attack and countermeasures
kazeburo
13
12k
高信頼IaaSを実現するDevOps / DevOps for Highly Reliable IaaS
kazeburo
1
560
権威DNSサービスへのDDoSと ハイパフォーマンスなベンチマーカ / DNS Pseudo random subdomain attack and High performance Benchmarker
kazeburo
3
5.2k
DNS権威サーバのクラウドサービス向けに行われた攻撃および対策 / DNS Pseudo-Random Subdomain Attack and mitigations
kazeburo
7
13k
sacloudns
kazeburo
2
320
「orchestratorとGTID運用を支える監視」の勉強 / Monitoring orchestrator and GTID operation
kazeburo
2
1.3k
Other Decks in Technology
See All in Technology
アジャイルでの品質の進化 Agile in Motion vol.1/20241118 Hiroyuki Sato
shift_evolve
0
170
Exadata Database Service on Dedicated Infrastructure(ExaDB-D) UI スクリーン・キャプチャ集
oracle4engineer
PRO
2
3.2k
飲食店データの分析事例とそれを支えるデータ基盤
kimujun
0
150
20241120_JAWS_東京_ランチタイムLT#17_AWS認定全冠の先へ
tsumita
2
300
Platform Engineering for Software Developers and Architects
syntasso
1
520
Introduction to Works of ML Engineer in LY Corporation
lycorp_recruit_jp
0
140
CDCL による厳密解法を採用した MILP ソルバー
imai448
3
120
VideoMamba: State Space Model for Efficient Video Understanding
chou500
0
190
Flutterによる 効率的なAndroid・iOS・Webアプリケーション開発の事例
recruitengineers
PRO
0
120
CysharpのOSS群から見るModern C#の現在地
neuecc
2
3.5k
Lambda10周年!Lambdaは何をもたらしたか
smt7174
2
110
Evangelismo técnico: ¿qué, cómo y por qué?
trishagee
0
360
Featured
See All Featured
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
28
2k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
109
49k
RailsConf 2023
tenderlove
29
900
GitHub's CSS Performance
jonrohan
1030
460k
Agile that works and the tools we love
rasmusluckow
327
21k
Statistics for Hackers
jakevdp
796
220k
Producing Creativity
orderedlist
PRO
341
39k
Making Projects Easy
brettharned
115
5.9k
VelocityConf: Rendering Performance Case Studies
addyosmani
325
24k
How to Ace a Technical Interview
jacobian
276
23k
A designer walks into a library…
pauljervisheath
204
24k
GraphQLとの向き合い方2022年版
quramy
43
13k
Transcript
Masahiro Nagano @kazeburo 2023/05/15 IaaSにおけるPlatform Engineeringとこれから(仮 Platform Engineering Meetup #2
Me • ⻑野雅広(ながのまさひろ) • Twitter/GitHub @kazeburo • さくらインターネット株式会社 クラウド事業本部
SRE室 室⻑ • mixi, livedoor (LINE), mercari を経て 2021年から現職
さくらのクラウド • 2011年のサービス開始から12年⽬ • 皆様のご⽀援のおかげです。 改めて感謝申し上げます
さくらのクラウド • 東京と⽯狩の2リージョンで展開 • 仮想サーバ/ディスク・ネットワークな どIaaS • VPCルータ、データベースなどの アプライアンス
• 2拠点での冗⻑化をサポートするロード バランサ、GSLB、DNSアプライアンス • スケールアップも可能なオートスケール
提供サービスの範囲拡⼤の取り組み お客様のDX化に向けたクラウド利⽤の様々なニーズに応え、 SaaS・PaaSへサービス提供範囲を拡⼤し、さらなる市場機会を創出 ヤマト宅急便の集荷依頼や匿名配送⼿続きが、ビジネス⽤の メッセージングアプリ「Slack」上でワンストップで⾏えるア プリケーションを本年2⽉より提供開始 エレコム株式会社、DXアンテナ株式会社と連携して、クラウ ド録画サービス「Antenna-eye」を2023年3⽉1⽇より提供開 始
ガバメントクラウドへの取り組み ガバメント領域での存在感を強めるため、ガバメント推進室が中⼼となりリレーションを構築 ガバメントクラウドをベンチマークとして「クラウドサービスの価値・技術⽔準を⾼める」
さくらのクラウド 開発の課題 これまでの10年を次の10年に繋ぐ • 既存のデータセンター・インフラ運⽤の維持継続 • IaaS コアシステムを現代化、技術⽔準の向上 • クラウドとして価値向上につながる機能拡充、新規サービス開発
⾼信頼とデリバリのパフォーマンスを両⽴
SRE / Platform Engineering
クラウド事業本部SRE室 • 2022年7⽉に発⾜。現在メンバーは5名 • 全社でのSREの取り組みがより評価されることを⽬的に発⾜ • 各部署でDevOps/SREの取り組みはされており、それを交換するものでは なく強化する • 社内での期待値のズレをなくすのが最初の課題
• 発⾜と同時にMission, Vision, Value の策定
SRE室のMission, Vision, Value • Mission • クラウドサービスの信頼性を⾼めることにより、お客様や社会のDXをしっかり⽀える • Vision •
社内でのSREの実践を広め、お客様への価値提供を⾏う • さくらのサービスそのものの信頼性向上、それにより価値向上を⽬指す • さくら社員がEnabling SREとして、お客様・社外のサービスの信頼性向上に携わる
SRE室のMission, Vision, Value • Value • 決め事を作るのではなく、⼀緒に”⼿を動かして”信頼性向上の⽂化をつくる • SRE室のエンジニアだけがSREs(Site Reliability
Engineers)ではない • SRE室のエンジニアが Embedded SRE / Enabling SREとして、SREの取り組みを拡⼤させていく • 開発・運⽤チームとの密なコミュニケーション • 期待値のズレ、お⾒合いを防ぐ • You built it, you run it • 開発/運⽤の両者が共通のゴールをもって、運⽤性に優れたソフトウェアを開発する
SRE室現在進⾏中の取り組み
SRE室現在進⾏中の取り組み • Kubernetes 基盤 • Sakura monitoring suite • Agile
culture の育成
Kubernetes 基盤
IUUQTLOPXMFEHFTBLVSBBEKQ
社内 Kubernetes 基盤 • 社内(プライベート)ネットワークに接続された「さくらのクラウド」上に開発 者が Kubernetes クラスタを構築できる基盤 • Cluster
API ベースで開発 • “マニフェスト”を元に、さくらのクラウドのAPIを利⽤しIaaSリソースを作 成する
ཧΫϥελ ϚχϑΣετཧ 3FQPTJUPSZ "SHP$% Ϛελʔ ϊʔυ Ϛελʔ ϊʔυ. ϫʔΧʔ ϊʔυ
ϫʔΧʔ ϊʔυ8 ϢʔβΫϥελ Ϛελʔ ϊʔυ Ϛελʔ ϊʔυ. ϫʔΧʔ ϊʔυ ϫʔΧʔ ϊʔυ8 ϢʔβΫϥελ ։ൃऀ ج൫ӡ༻ऀ Ϋϥελʹؔ͢Δ ϚχϡϑΣετΛ13 ϨϏϡʔ "VUP4ZOD CVJMENBOBHF CVJMENBOBHF ར༻
社内での Kubernetes 運⽤課題の洗い出し • 社内においていくつかのチームで独⾃にクラスタを運⽤ • さくらのクラウド上、物理サーバ上など環境は様々 • トラブル時の運⽤、クラスタのアップデートなどの課題は共通 •
課題をヒアリングから洗い出し、基盤開発へのフィードバック
社内 Kubernetes 運営コミュニティの開始 • SKOG “Sakura Kubernetes Operators Group” の発⾜
• Slack ベースでの情報共有 • オンラインでの勉強会の開催
社内 Kubernetes 基盤の課題 • 社内 Kubernetes 基盤への要望 • インターネットからのリーチャビリティ •
マルチリージョンの冗⻑性確保
社内 Kubernetes 基盤の課題 • 期待値のズレ • 開発者はアプリケーション実⾏基盤が欲しい • 基盤の利⽤は⼀部に限られている状態 •
Actions Runner Controllerなど
社内 Kubernetes 基盤の今後 • 「アプリケーションを動作させることに集中したい」を課題の中⼼に
社内 Kubernetes 基盤の今後 • 共有クラスタ(shared-k8s)の構築・運⽤ • Namespaceによるマルチテナント • 社外(インターネット)からのトラフィックを受付 •
堅牢性向上 / 東京・⽯狩での冗⻑性確保 • ログ、メトリクス永続化の組み込み • セルフサービスに基づいたポリシー
Sakura monitoring suite
Observability を⽀える課題 • ⻑期間のデータを格納するため⼤規模なストレージが必要 • ⾼可⽤性の担保。複雑なクラスタの運⽤ • 定期アップデートなどのメンテナンス
Sakura monitoring suite • Observability を実現する際の開発者にとっての負担を軽減 • monitoring suiteではメトリクスとログをサポート
Sakura monitoring suite (メトリクス) • Prometheus の Remote Storage を提供
• アルファ版として社内で提供中 • バックボーンネットワークの可視化 • エンハンスドDB(TiDB)
Sakura monitoring suite (ログ) • アクセスログや構造化ログに対して⾼速にクエリ • 低コストでの運⽤の実現、スケールするサービスを⽬指し開発中 • Trino(クエリエンジン)、Apache
Iceburg(テーブルフォーマット)を採⽤予定 • 開発者のneedsをとらえていくため Demo を重要視
Agile culture の育成
Enabling SREを通した⽂化の育成 • さくらのクラウドのアプライアンス開発・運⽤に課題 • ISSUEやお客様からの問い合わせ対応に遅延 • 該当アプライアンスサービスを活⽤した他のサービスに影響 • SRE室からEnabling
SREとしてチームに参加
Enabling SREとしての活動 • チームビルディング • オンラインでの朝(⼣)会、定例の開催 • 特定の個⼈に頼らないISSUE・障害対応 • Blamelessなふりかえり
• ドキュメンテーション⽂化 • ロードマップの作成
Enabling SREとしての今後 • Observability の向上 • Sakura monitoring suiteの活⽤ •
SLI/SLOの策定 • ⾼信頼というの価値提供 • ⾃律的なチームへ
Reading Club on Team building • SRE室と開発チームのリーダで開催 • 「⾔葉/⾔語」の共通化と課題の明確化 •
アジャイルの本部全体への展開 Four Keysなど次のアクション • メンバー同⼠の相互理解/信頼感の醸成
IaaSにおけるPlatform Engineeringとこれから • システムと⽂化の両⾯で⾼信頼のクラウドを⽀える • Platform Engineering (SRE as a
Serviceの提供) • アジャイル⽂化の醸成 • DevとOps / Dev と SREs の期待値を合わせる • MVVの定義 • アウトカムの最⼤化に必要
SAKURA internet ࣾձΛࢧ͑Δ ύϒϦοΫΫϥυΛ Ұॹʹ࡞Γ·ͤΜ͔ʁ Perl, Go, Python
インフラ基盤から フロントエンドまで 採⽤強化中! さくらインターネットではエン ジ ニア採⽤を強化しています さくらインターネットは新たなアイ デ アの創出に強い熱意と情熱を持って挑戦するお客様を は じ め、私たちとつな が りのあるす べ ての⼈たちのために、未来のある べ き姿を想い描きな が ら ―「やりたいこと」を「 で きる」に変える ― あらゆるア プ ローチを “インターネッ ト”を通 じ て提供します。 詳しくはWebサイトにて、カジュアル⾯談もやってます 👉 www.sakura.ad.jp/lp/22engineer/
ご清聴ありがとうございました 質問などありましたらお気軽に