Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Mercari Engineer Meetup
Search
Keke
September 25, 2019
Technology
1
3k
Mercari Engineer Meetup
Keke
September 25, 2019
Tweet
Share
More Decks by Keke
See All by Keke
リモートワークを支える勤怠管理 ~プラットフォームとしてのSlackの活用 ~
keisukeyamashita
0
650
Serving GitHub Actions Self-Hosted Runner as a Platform (Part 1: Introduction)
keisukeyamashita
0
370
Serverlessを取り巻く現状とAll Serverlessでプロダクトを構築する苦労
keisukeyamashita
10
3k
Spinnakerで実践するマイクロサービスの 安全なリリースフローとベストプラクティス
keisukeyamashita
3
1.1k
Spinnaker Application management by Terraform Plugins
keisukeyamashita
2
880
Open Policy AgentとSpinnakerで実現するマイクロサービスの安全な継続的デリバリー
keisukeyamashita
8
6.2k
How to develop a custom Terraform provider@Merpay SRE Tech Talk
keisukeyamashita
0
410
Introduction to Spinnaker Managed Pipeline Templates
keisukeyamashita
3
6.6k
Cloud Runでシステムを作るためのアーキテクチャのTipsとコストの話
keisukeyamashita
3
1.5k
Other Decks in Technology
See All in Technology
ユーザーストーリーマッピングから始めるアジャイルチームと並走するQA / Starting QA with User Story Mapping
katawara
0
200
運用しているアプリケーションのDBのリプレイスをやってみた
miura55
1
680
急成長する企業で作った、エンジニアが輝ける制度/ 20250214 Rinto Ikenoue
shift_evolve
3
1.2k
君も受託系GISエンジニアにならないか
sudataka
2
420
Platform Engineeringは自由のめまい
nwiizo
4
2k
飲食店予約台帳を支えるインタラクティブ UI 設計と実装
siropaca
7
1.7k
Cloud Spanner 導入で実現した快適な開発と運用について
colopl
1
510
開発スピードは上がっている…品質はどうする? スピードと品質を両立させるためのプロダクト開発の進め方とは #DevSumi #DevSumiB / Agile And Quality
nihonbuson
2
2.8k
Amazon S3 Tablesと外部分析基盤連携について / Amazon S3 Tables and External Data Analytics Platform
nttcom
0
130
【Developers Summit 2025】プロダクトエンジニアから学ぶ、 ユーザーにより高い価値を届ける技術
niwatakeru
2
1.3k
Swiftの “private” を テストする / Testing Swift "private"
yutailang0119
0
130
バックエンドエンジニアのためのフロントエンド入門 #devsumiC
panda_program
18
7.3k
Featured
See All Featured
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5.2k
VelocityConf: Rendering Performance Case Studies
addyosmani
328
24k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.7k
Navigating Team Friction
lara
183
15k
Six Lessons from altMBA
skipperchong
27
3.6k
Designing Experiences People Love
moore
140
23k
Practical Orchestrator
shlominoach
186
10k
The World Runs on Bad Software
bkeepers
PRO
67
11k
Large-scale JavaScript Application Architecture
addyosmani
511
110k
Docker and Python
trallard
44
3.3k
Done Done
chrislema
182
16k
We Have a Design System, Now What?
morganepeng
51
7.4k
Transcript
@keke 2019/09/25 Engineer’s Meetup for Students
自己紹介 01 02 03 学生時代のエンジニア経験 2年前のメルカリとの接点からメルペイ入社まで話 What’s SRE メルペイ SREではどんな技術を使って、どんなことをしてるの?
新卒SREは日頃、何をしているのか メルペイ SREと自分は何をしてるのか Backend EngineerやML Engineerとかって馴染みあるけど、SREって? 2 Outlines for Today
自己紹介 3
4 Keke (Twitter: @_k_e_k_e) 2017.3 Mercari BOLD Internship in USA
2019.4- Merpay, New Graduate (SRE Team)
5 Mercari Tech Blog
6 Meetup パネラーとして登壇@2019/09/11
7 Meetup GCPUG Yokohama 勤怠を自動化する技術 Ansible Night
2017.3 第一期生 2019.4 BOLD Internship in USA
メルカリ Join メルカリ外で 色々な長期&短期インターン 2019.2 ここで興味が湧き、Joinを検討。 応募する。 メルペイ機能リリース 8 エンジニア経験とメルカリ・メルペイとの接点 (Backend, SRE, iOS, Blockchain, Hardware) 2019.6 メルペイ SRE Join
9 約2年間なにも接点がなかったが、 メルペイリリースのタイミングなどの理由で就職した「母川回帰タイプ」 イラスト: https://en.wikipedia.org/wiki/Chum_salmon#/media/File:Salmo_salar_GLERL_1.jpg エンジニア経験とメルカリ・メルペイとの接点
メルペイのMission、事業内容の共感でき、 業界への世間の注目度が非常に高い点 MercariのSREのプレゼンスは非常に高い点 SREが守る金融事業は 技術レベルの要求が高く、幅広い点 01 02 03 10 なぜ入社したか、3つのPoint
What’s SRE 11
Site Reliability Engineering ・Googleが最初に作ったエンジニアの職種(SRE) “Site Reliability Engineeringとは、ある組織が、組織のシステム、サービスやプロダクト適切な信頼性のレ ベルを勝ち得るまで貢献するエンジニア工学の概念である”
(SRE Essentials https://speakerdeck.com/jhand/sre-essentials?slide=8) 12 What’s SRE
13 What’s SRE 引用: “What’s the Difference Between DevOps and
SRE?” https://www.youtube.com/watch?v=uTEL8Ff1Zvk&list=PLIivdWyY5sqJrKl7D2u-gmis8h9K66qoj&index=2&t=0s
14 What’s SRE 「信頼性は一つの機能」 SLO (サービスレベル目標) とエラーバジェットを元にDeveloperと交渉をする。 例:
99.99%のAvailabilityをSLOとするサービスならば、約4分/月のダウンタイムが許される。 4分を超えるダウンタイムが発生する機能などはSREはリリースを許可しない。 それをソフトウェア的な問題と捉え、改善などをはかる。
15 What’s SRE 詳しく知りたい人へ 『SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム』 https://amzn.to/2Qay281
メルペイ SREと自分は何をしてるのか 16
メルペイ SRE チーム 17
#mercari_merpay_sre_msp Merpay SRE Responsibility • メルペイという金融サービスのReliability • 開発者がReliabilityを実現するための仕組みづくり Projects •
メルペイのインフラの構築・運用 • メルペイのマイクロサービスのReliability(リリース・監視) • メルペイのマイクロサービスのOperationと改善(自動化、ツール化) 参考資料: 「メルペイのマイクロサービスの構築と運用 / Cloud Native Days 2019」
#mercari_merpay_sre_msp マイクロサービスアーキテクチャ 参考資料: 「メルペイのマイクロサービスの構築と運用 / Cloud Native Days 2019」
自分 20
#mercari_merpay_sre_msp My Project Improve Observability • Cloud Spannerのモニタリング • Kubernetesのネットワークスタッツの取得、および可視化
• PagerDutyを使ったオンコール対応の監視 • Terraformによる宣言的なモニタリングダッシュボードの作成 モニタリングダッシュボードにはDatadogを使用
#mercari_merpay_sre_msp 1. Cloud Spannerのモニタリング Cloud Spannerとは • Google Cloud Platformだけで独自に提供されているデータベース
• “グローバルおよびリージョナル アプリケーション データ向けのスケーラブルなフルマネージ ド リレーショナル データベース サービス” 何をしているのか • GAEとCloud Dataflowをあわせたバックアップ運用、およびその監視 • インスタンスやデータベースのリソース監視 • 監視はDatadogを使い、そのDashboardにはTerraformを使用
#mercari_merpay_sre_msp 2. Kubernetesのネットワークスタットの取得、可視化 ネットワークスタットって • ラウンドトリップレイテンシをはじめ、 DNSルックアップ時間やTCPコネクション時間などの 統計情報のこと • 一般的なRPCであるHTTP/1.1
や 、HTTP/2.0の上で構築されているgRPCを対象としてい る なんでしているのか • レイテンシ増加など、ネットワークに関する問題がたまにある ◦ 問題をドリルダウンして、早期の原因特定のため • すべてのPodの実行環境が同環境ではないので、環境ごとの差異を知るため ◦ リージョンやゾーンなどの地理的環境 ◦ ホストのCPUやメモリなどのリソース環境など
#mercari_merpay_sre_msp 日頃、どんな技術を普段使ってる?
15% 35% 50% おおまかに、ここ最近の時間比率 25
#mercari_merpay_sre_msp IT全体で SREはどんどん増えているため 選択肢の一つとして魅力的! なんでも聞いてください :)
(余談) フレックス制について 27
#mercari_merpay_sre_msp 突然ですが... 朝型の人っていますか?
#mercari_merpay_sre_msp フレックス制(コアタイム12:00 - 16:00)は 不安だった...
コアタイム外に予定入ったりするかも? 01 02 タスクで夜遅くまでいないといけなくなる? 30 想定していた主な不安
コアタイム外に予定入ったりするかも? 01 02 ミーティングなど基本は入らない。 適切な理由があれば入ることもあるが、滅多にない。 タスクで夜遅くまでいないといけなくなる? 早急に対応が必要でないときは「これ、明日でいいですよ」など 一言いってくれる人が多い。 フレックス制が広く浸透していると感じている。 31
想定していた主な不安
#mercari_merpay_sre_msp 働きやすい = 生活がしやすい
Thank you! 33 Keke Twitter: @_k_e_k_e