Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Mercari Engineer Meetup
Search
Keke
September 25, 2019
Technology
1
3k
Mercari Engineer Meetup
Keke
September 25, 2019
Tweet
Share
More Decks by Keke
See All by Keke
リモートワークを支える勤怠管理 ~プラットフォームとしてのSlackの活用 ~
keisukeyamashita
0
680
Serving GitHub Actions Self-Hosted Runner as a Platform (Part 1: Introduction)
keisukeyamashita
0
410
Serverlessを取り巻く現状とAll Serverlessでプロダクトを構築する苦労
keisukeyamashita
10
3.1k
Spinnakerで実践するマイクロサービスの 安全なリリースフローとベストプラクティス
keisukeyamashita
3
1.1k
Spinnaker Application management by Terraform Plugins
keisukeyamashita
2
910
Open Policy AgentとSpinnakerで実現するマイクロサービスの安全な継続的デリバリー
keisukeyamashita
8
6.3k
How to develop a custom Terraform provider@Merpay SRE Tech Talk
keisukeyamashita
0
430
Introduction to Spinnaker Managed Pipeline Templates
keisukeyamashita
3
6.8k
Cloud Runでシステムを作るためのアーキテクチャのTipsとコストの話
keisukeyamashita
3
1.5k
Other Decks in Technology
See All in Technology
~宇宙最速~2025年AWS Summit レポート
satodesu
1
830
DenoとJSRで実現する最速MCPサーバー開発記 / Building MCP Servers at Lightning Speed with Deno and JSR
yamanoku
1
250
2025/6/21 日本学術会議公開シンポジウム発表資料
keisuke198619
2
470
Microsoft Build 2025 技術/製品動向 for Microsoft Startup Tech Community
torumakabe
1
190
CSS、JSをHTMLテンプレートにまとめるフロントエンド戦略
d120145
0
190
成立するElixirの再束縛(再代入)可という選択
kubell_hr
0
530
JSX - 歴史を振り返り、⾯⽩がって、エモくなろう
pal4de
3
1k
Navigation3でViewModelにデータを渡す方法
mikanichinose
0
200
【TiDB GAME DAY 2025】Shadowverse: Worlds Beyond にみる TiDB 活用術
cygames
0
660
AIのAIによるAIのための出力評価と改善
chocoyama
0
420
25分で解説する「最小権限の原則」を実現するための AWS「ポリシー」大全 / 20250625-aws-summit-aws-policy
opelab
6
630
原則から考える保守しやすいComposable関数設計
moriatsushi
3
500
Featured
See All Featured
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
32
5.9k
Stop Working from a Prison Cell
hatefulcrawdad
269
20k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
A Tale of Four Properties
chriscoyier
159
23k
Why You Should Never Use an ORM
jnunemaker
PRO
56
9.4k
A designer walks into a library…
pauljervisheath
206
24k
Visualization
eitanlees
146
16k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
43
2.4k
Optimising Largest Contentful Paint
csswizardry
37
3.3k
4 Signs Your Business is Dying
shpigford
184
22k
The Straight Up "How To Draw Better" Workshop
denniskardys
233
140k
Transcript
@keke 2019/09/25 Engineer’s Meetup for Students
自己紹介 01 02 03 学生時代のエンジニア経験 2年前のメルカリとの接点からメルペイ入社まで話 What’s SRE メルペイ SREではどんな技術を使って、どんなことをしてるの?
新卒SREは日頃、何をしているのか メルペイ SREと自分は何をしてるのか Backend EngineerやML Engineerとかって馴染みあるけど、SREって? 2 Outlines for Today
自己紹介 3
4 Keke (Twitter: @_k_e_k_e) 2017.3 Mercari BOLD Internship in USA
2019.4- Merpay, New Graduate (SRE Team)
5 Mercari Tech Blog
6 Meetup パネラーとして登壇@2019/09/11
7 Meetup GCPUG Yokohama 勤怠を自動化する技術 Ansible Night
2017.3 第一期生 2019.4 BOLD Internship in USA
メルカリ Join メルカリ外で 色々な長期&短期インターン 2019.2 ここで興味が湧き、Joinを検討。 応募する。 メルペイ機能リリース 8 エンジニア経験とメルカリ・メルペイとの接点 (Backend, SRE, iOS, Blockchain, Hardware) 2019.6 メルペイ SRE Join
9 約2年間なにも接点がなかったが、 メルペイリリースのタイミングなどの理由で就職した「母川回帰タイプ」 イラスト: https://en.wikipedia.org/wiki/Chum_salmon#/media/File:Salmo_salar_GLERL_1.jpg エンジニア経験とメルカリ・メルペイとの接点
メルペイのMission、事業内容の共感でき、 業界への世間の注目度が非常に高い点 MercariのSREのプレゼンスは非常に高い点 SREが守る金融事業は 技術レベルの要求が高く、幅広い点 01 02 03 10 なぜ入社したか、3つのPoint
What’s SRE 11
Site Reliability Engineering ・Googleが最初に作ったエンジニアの職種(SRE) “Site Reliability Engineeringとは、ある組織が、組織のシステム、サービスやプロダクト適切な信頼性のレ ベルを勝ち得るまで貢献するエンジニア工学の概念である”
(SRE Essentials https://speakerdeck.com/jhand/sre-essentials?slide=8) 12 What’s SRE
13 What’s SRE 引用: “What’s the Difference Between DevOps and
SRE?” https://www.youtube.com/watch?v=uTEL8Ff1Zvk&list=PLIivdWyY5sqJrKl7D2u-gmis8h9K66qoj&index=2&t=0s
14 What’s SRE 「信頼性は一つの機能」 SLO (サービスレベル目標) とエラーバジェットを元にDeveloperと交渉をする。 例:
99.99%のAvailabilityをSLOとするサービスならば、約4分/月のダウンタイムが許される。 4分を超えるダウンタイムが発生する機能などはSREはリリースを許可しない。 それをソフトウェア的な問題と捉え、改善などをはかる。
15 What’s SRE 詳しく知りたい人へ 『SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム』 https://amzn.to/2Qay281
メルペイ SREと自分は何をしてるのか 16
メルペイ SRE チーム 17
#mercari_merpay_sre_msp Merpay SRE Responsibility • メルペイという金融サービスのReliability • 開発者がReliabilityを実現するための仕組みづくり Projects •
メルペイのインフラの構築・運用 • メルペイのマイクロサービスのReliability(リリース・監視) • メルペイのマイクロサービスのOperationと改善(自動化、ツール化) 参考資料: 「メルペイのマイクロサービスの構築と運用 / Cloud Native Days 2019」
#mercari_merpay_sre_msp マイクロサービスアーキテクチャ 参考資料: 「メルペイのマイクロサービスの構築と運用 / Cloud Native Days 2019」
自分 20
#mercari_merpay_sre_msp My Project Improve Observability • Cloud Spannerのモニタリング • Kubernetesのネットワークスタッツの取得、および可視化
• PagerDutyを使ったオンコール対応の監視 • Terraformによる宣言的なモニタリングダッシュボードの作成 モニタリングダッシュボードにはDatadogを使用
#mercari_merpay_sre_msp 1. Cloud Spannerのモニタリング Cloud Spannerとは • Google Cloud Platformだけで独自に提供されているデータベース
• “グローバルおよびリージョナル アプリケーション データ向けのスケーラブルなフルマネージ ド リレーショナル データベース サービス” 何をしているのか • GAEとCloud Dataflowをあわせたバックアップ運用、およびその監視 • インスタンスやデータベースのリソース監視 • 監視はDatadogを使い、そのDashboardにはTerraformを使用
#mercari_merpay_sre_msp 2. Kubernetesのネットワークスタットの取得、可視化 ネットワークスタットって • ラウンドトリップレイテンシをはじめ、 DNSルックアップ時間やTCPコネクション時間などの 統計情報のこと • 一般的なRPCであるHTTP/1.1
や 、HTTP/2.0の上で構築されているgRPCを対象としてい る なんでしているのか • レイテンシ増加など、ネットワークに関する問題がたまにある ◦ 問題をドリルダウンして、早期の原因特定のため • すべてのPodの実行環境が同環境ではないので、環境ごとの差異を知るため ◦ リージョンやゾーンなどの地理的環境 ◦ ホストのCPUやメモリなどのリソース環境など
#mercari_merpay_sre_msp 日頃、どんな技術を普段使ってる?
15% 35% 50% おおまかに、ここ最近の時間比率 25
#mercari_merpay_sre_msp IT全体で SREはどんどん増えているため 選択肢の一つとして魅力的! なんでも聞いてください :)
(余談) フレックス制について 27
#mercari_merpay_sre_msp 突然ですが... 朝型の人っていますか?
#mercari_merpay_sre_msp フレックス制(コアタイム12:00 - 16:00)は 不安だった...
コアタイム外に予定入ったりするかも? 01 02 タスクで夜遅くまでいないといけなくなる? 30 想定していた主な不安
コアタイム外に予定入ったりするかも? 01 02 ミーティングなど基本は入らない。 適切な理由があれば入ることもあるが、滅多にない。 タスクで夜遅くまでいないといけなくなる? 早急に対応が必要でないときは「これ、明日でいいですよ」など 一言いってくれる人が多い。 フレックス制が広く浸透していると感じている。 31
想定していた主な不安
#mercari_merpay_sre_msp 働きやすい = 生活がしやすい
Thank you! 33 Keke Twitter: @_k_e_k_e