$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
IaaSにおけるPlatform Engineeringとこれから / Platform en...
Search
kazeburo
May 15, 2023
Technology
2
1.3k
IaaSにおけるPlatform Engineeringとこれから / Platform engineering in IaaS
IaaSにおけるPlatform Engineeringとこれから
Platform Engineering Meetup #2
2023/05/15
kazeburo
May 15, 2023
Tweet
Share
More Decks by kazeburo
See All by kazeburo
[さくらのTech Day] ガバメントクラウド開発と変化と成長する組織 / sakura techday, Develop govcloud and the team
kazeburo
0
690
ガバメントクラウド開発と変化と成長する組織 / Organizational change and growth in developing a government cloud
kazeburo
4
1.9k
DNS水責め攻撃と監視 / DNS water torture attack Monitoring and SLO
kazeburo
5
4k
DBやめてみた / DNS water torture attack and countermeasures
kazeburo
13
13k
高信頼IaaSを実現するDevOps / DevOps for Highly Reliable IaaS
kazeburo
1
560
権威DNSサービスへのDDoSと ハイパフォーマンスなベンチマーカ / DNS Pseudo random subdomain attack and High performance Benchmarker
kazeburo
3
5.2k
DNS権威サーバのクラウドサービス向けに行われた攻撃および対策 / DNS Pseudo-Random Subdomain Attack and mitigations
kazeburo
7
13k
sacloudns
kazeburo
2
320
「orchestratorとGTID運用を支える監視」の勉強 / Monitoring orchestrator and GTID operation
kazeburo
2
1.3k
Other Decks in Technology
See All in Technology
情シスの引継ぎが大変という話
miyu_dev
2
530
ONNX推論クレートの比較と実装奮闘記
emergent
0
270
Microsoft Ignite 2024 Update 1 - AIとIoT関連の最新情報をどこよりも早く!
iotcomjpadmin
0
290
レガシーシステムへのDatadog APM導入奮闘記
mtakeya4062
0
130
ARRが3年で10倍になったプロダクト開発とAI活用の軌跡
akiroom
0
190
Entra ID の多要素認証(Japan Microsoft 365 コミュニティ カンファレンス 2024 )
murachiakira
0
1.7k
PFN Company Deck
pfn
PRO
2
140
4年で17倍に成長したエンジニア組織を支えるアーキテクチャの過去と未来
sansantech
PRO
1
4.8k
Engineer Recruting Deck
siva_official
PRO
1
3.2k
マルチプロダクト、マルチデータ基盤での Looker活用事例 〜BQじゃなくてもLookerはいいぞ〜
gappy50
0
120
asumikamというカンファレンスオーガナイザの凄さを語る / The Brilliance of Asumikam
tomzoh
1
170
次のコンテナセキュリティの時代 - User Namespace With a Pod / CloudNative Days Winter 2024
pfn
PRO
5
430
Featured
See All Featured
Producing Creativity
orderedlist
PRO
341
39k
Large-scale JavaScript Application Architecture
addyosmani
510
110k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
760
Navigating Team Friction
lara
183
15k
A Philosophy of Restraint
colly
203
16k
Typedesign – Prime Four
hannesfritz
40
2.4k
Testing 201, or: Great Expectations
jmmastey
40
7.1k
GraphQLとの向き合い方2022年版
quramy
44
13k
Facilitating Awesome Meetings
lara
50
6.1k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
169
50k
Into the Great Unknown - MozCon
thekraken
33
1.5k
Transcript
Masahiro Nagano @kazeburo 2023/05/15 IaaSにおけるPlatform Engineeringとこれから(仮 Platform Engineering Meetup #2
Me • ⻑野雅広(ながのまさひろ) • Twitter/GitHub @kazeburo • さくらインターネット株式会社 クラウド事業本部
SRE室 室⻑ • mixi, livedoor (LINE), mercari を経て 2021年から現職
さくらのクラウド • 2011年のサービス開始から12年⽬ • 皆様のご⽀援のおかげです。 改めて感謝申し上げます
さくらのクラウド • 東京と⽯狩の2リージョンで展開 • 仮想サーバ/ディスク・ネットワークな どIaaS • VPCルータ、データベースなどの アプライアンス
• 2拠点での冗⻑化をサポートするロード バランサ、GSLB、DNSアプライアンス • スケールアップも可能なオートスケール
提供サービスの範囲拡⼤の取り組み お客様のDX化に向けたクラウド利⽤の様々なニーズに応え、 SaaS・PaaSへサービス提供範囲を拡⼤し、さらなる市場機会を創出 ヤマト宅急便の集荷依頼や匿名配送⼿続きが、ビジネス⽤の メッセージングアプリ「Slack」上でワンストップで⾏えるア プリケーションを本年2⽉より提供開始 エレコム株式会社、DXアンテナ株式会社と連携して、クラウ ド録画サービス「Antenna-eye」を2023年3⽉1⽇より提供開 始
ガバメントクラウドへの取り組み ガバメント領域での存在感を強めるため、ガバメント推進室が中⼼となりリレーションを構築 ガバメントクラウドをベンチマークとして「クラウドサービスの価値・技術⽔準を⾼める」
さくらのクラウド 開発の課題 これまでの10年を次の10年に繋ぐ • 既存のデータセンター・インフラ運⽤の維持継続 • IaaS コアシステムを現代化、技術⽔準の向上 • クラウドとして価値向上につながる機能拡充、新規サービス開発
⾼信頼とデリバリのパフォーマンスを両⽴
SRE / Platform Engineering
クラウド事業本部SRE室 • 2022年7⽉に発⾜。現在メンバーは5名 • 全社でのSREの取り組みがより評価されることを⽬的に発⾜ • 各部署でDevOps/SREの取り組みはされており、それを交換するものでは なく強化する • 社内での期待値のズレをなくすのが最初の課題
• 発⾜と同時にMission, Vision, Value の策定
SRE室のMission, Vision, Value • Mission • クラウドサービスの信頼性を⾼めることにより、お客様や社会のDXをしっかり⽀える • Vision •
社内でのSREの実践を広め、お客様への価値提供を⾏う • さくらのサービスそのものの信頼性向上、それにより価値向上を⽬指す • さくら社員がEnabling SREとして、お客様・社外のサービスの信頼性向上に携わる
SRE室のMission, Vision, Value • Value • 決め事を作るのではなく、⼀緒に”⼿を動かして”信頼性向上の⽂化をつくる • SRE室のエンジニアだけがSREs(Site Reliability
Engineers)ではない • SRE室のエンジニアが Embedded SRE / Enabling SREとして、SREの取り組みを拡⼤させていく • 開発・運⽤チームとの密なコミュニケーション • 期待値のズレ、お⾒合いを防ぐ • You built it, you run it • 開発/運⽤の両者が共通のゴールをもって、運⽤性に優れたソフトウェアを開発する
SRE室現在進⾏中の取り組み
SRE室現在進⾏中の取り組み • Kubernetes 基盤 • Sakura monitoring suite • Agile
culture の育成
Kubernetes 基盤
IUUQTLOPXMFEHFTBLVSBBEKQ
社内 Kubernetes 基盤 • 社内(プライベート)ネットワークに接続された「さくらのクラウド」上に開発 者が Kubernetes クラスタを構築できる基盤 • Cluster
API ベースで開発 • “マニフェスト”を元に、さくらのクラウドのAPIを利⽤しIaaSリソースを作 成する
ཧΫϥελ ϚχϑΣετཧ 3FQPTJUPSZ "SHP$% Ϛελʔ ϊʔυ Ϛελʔ ϊʔυ. ϫʔΧʔ ϊʔυ
ϫʔΧʔ ϊʔυ8 ϢʔβΫϥελ Ϛελʔ ϊʔυ Ϛελʔ ϊʔυ. ϫʔΧʔ ϊʔυ ϫʔΧʔ ϊʔυ8 ϢʔβΫϥελ ։ൃऀ ج൫ӡ༻ऀ Ϋϥελʹؔ͢Δ ϚχϡϑΣετΛ13 ϨϏϡʔ "VUP4ZOD CVJMENBOBHF CVJMENBOBHF ར༻
社内での Kubernetes 運⽤課題の洗い出し • 社内においていくつかのチームで独⾃にクラスタを運⽤ • さくらのクラウド上、物理サーバ上など環境は様々 • トラブル時の運⽤、クラスタのアップデートなどの課題は共通 •
課題をヒアリングから洗い出し、基盤開発へのフィードバック
社内 Kubernetes 運営コミュニティの開始 • SKOG “Sakura Kubernetes Operators Group” の発⾜
• Slack ベースでの情報共有 • オンラインでの勉強会の開催
社内 Kubernetes 基盤の課題 • 社内 Kubernetes 基盤への要望 • インターネットからのリーチャビリティ •
マルチリージョンの冗⻑性確保
社内 Kubernetes 基盤の課題 • 期待値のズレ • 開発者はアプリケーション実⾏基盤が欲しい • 基盤の利⽤は⼀部に限られている状態 •
Actions Runner Controllerなど
社内 Kubernetes 基盤の今後 • 「アプリケーションを動作させることに集中したい」を課題の中⼼に
社内 Kubernetes 基盤の今後 • 共有クラスタ(shared-k8s)の構築・運⽤ • Namespaceによるマルチテナント • 社外(インターネット)からのトラフィックを受付 •
堅牢性向上 / 東京・⽯狩での冗⻑性確保 • ログ、メトリクス永続化の組み込み • セルフサービスに基づいたポリシー
Sakura monitoring suite
Observability を⽀える課題 • ⻑期間のデータを格納するため⼤規模なストレージが必要 • ⾼可⽤性の担保。複雑なクラスタの運⽤ • 定期アップデートなどのメンテナンス
Sakura monitoring suite • Observability を実現する際の開発者にとっての負担を軽減 • monitoring suiteではメトリクスとログをサポート
Sakura monitoring suite (メトリクス) • Prometheus の Remote Storage を提供
• アルファ版として社内で提供中 • バックボーンネットワークの可視化 • エンハンスドDB(TiDB)
Sakura monitoring suite (ログ) • アクセスログや構造化ログに対して⾼速にクエリ • 低コストでの運⽤の実現、スケールするサービスを⽬指し開発中 • Trino(クエリエンジン)、Apache
Iceburg(テーブルフォーマット)を採⽤予定 • 開発者のneedsをとらえていくため Demo を重要視
Agile culture の育成
Enabling SREを通した⽂化の育成 • さくらのクラウドのアプライアンス開発・運⽤に課題 • ISSUEやお客様からの問い合わせ対応に遅延 • 該当アプライアンスサービスを活⽤した他のサービスに影響 • SRE室からEnabling
SREとしてチームに参加
Enabling SREとしての活動 • チームビルディング • オンラインでの朝(⼣)会、定例の開催 • 特定の個⼈に頼らないISSUE・障害対応 • Blamelessなふりかえり
• ドキュメンテーション⽂化 • ロードマップの作成
Enabling SREとしての今後 • Observability の向上 • Sakura monitoring suiteの活⽤ •
SLI/SLOの策定 • ⾼信頼というの価値提供 • ⾃律的なチームへ
Reading Club on Team building • SRE室と開発チームのリーダで開催 • 「⾔葉/⾔語」の共通化と課題の明確化 •
アジャイルの本部全体への展開 Four Keysなど次のアクション • メンバー同⼠の相互理解/信頼感の醸成
IaaSにおけるPlatform Engineeringとこれから • システムと⽂化の両⾯で⾼信頼のクラウドを⽀える • Platform Engineering (SRE as a
Serviceの提供) • アジャイル⽂化の醸成 • DevとOps / Dev と SREs の期待値を合わせる • MVVの定義 • アウトカムの最⼤化に必要
SAKURA internet ࣾձΛࢧ͑Δ ύϒϦοΫΫϥυΛ Ұॹʹ࡞Γ·ͤΜ͔ʁ Perl, Go, Python
インフラ基盤から フロントエンドまで 採⽤強化中! さくらインターネットではエン ジ ニア採⽤を強化しています さくらインターネットは新たなアイ デ アの創出に強い熱意と情熱を持って挑戦するお客様を は じ め、私たちとつな が りのあるす べ ての⼈たちのために、未来のある べ き姿を想い描きな が ら ―「やりたいこと」を「 で きる」に変える ― あらゆるア プ ローチを “インターネッ ト”を通 じ て提供します。 詳しくはWebサイトにて、カジュアル⾯談もやってます 👉 www.sakura.ad.jp/lp/22engineer/
ご清聴ありがとうございました 質問などありましたらお気軽に