Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Mercari Engineer Meetup
Search
Keke
September 25, 2019
Technology
1
3.1k
Mercari Engineer Meetup
Keke
September 25, 2019
Tweet
Share
More Decks by Keke
See All by Keke
リモートワークを支える勤怠管理 ~プラットフォームとしてのSlackの活用 ~
keisukeyamashita
0
730
Serving GitHub Actions Self-Hosted Runner as a Platform (Part 1: Introduction)
keisukeyamashita
0
490
Serverlessを取り巻く現状とAll Serverlessでプロダクトを構築する苦労
keisukeyamashita
10
3.2k
Spinnakerで実践するマイクロサービスの 安全なリリースフローとベストプラクティス
keisukeyamashita
3
1.2k
Spinnaker Application management by Terraform Plugins
keisukeyamashita
2
960
Open Policy AgentとSpinnakerで実現するマイクロサービスの安全な継続的デリバリー
keisukeyamashita
8
6.5k
How to develop a custom Terraform provider@Merpay SRE Tech Talk
keisukeyamashita
0
470
Introduction to Spinnaker Managed Pipeline Templates
keisukeyamashita
3
6.9k
Cloud Runでシステムを作るためのアーキテクチャのTipsとコストの話
keisukeyamashita
3
1.5k
Other Decks in Technology
See All in Technology
入社1ヶ月でデータパイプライン講座を作った話
waiwai2111
1
220
CDKで始めるTypeScript開発のススメ
tsukuboshi
1
290
~Everything as Codeを諦めない~ 後からCDK
mu7889yoon
3
250
AIと新時代を切り拓く。これからのSREとメルカリIBISの挑戦
0gm
0
670
【5分でわかる】セーフィー エンジニア向け会社紹介
safie_recruit
0
41k
AI時代、1年目エンジニアの悩み
jin4
1
160
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
10k
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.5k
あたらしい上流工程の形。 0日導入からはじめるAI駆動PM
kumaiu
5
750
Kiro IDEのドキュメントを全部読んだので地味だけどちょっと嬉しい機能を紹介する
khmoryz
0
150
予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善
muziyoshiz
1
1.4k
ファインディの横断SREがTakumi byGMOと取り組む、セキュリティと開発スピードの両立
rvirus0817
1
1k
Featured
See All Featured
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Accessibility Awareness
sabderemane
0
47
The browser strikes back
jonoalderson
0
360
RailsConf 2023
tenderlove
30
1.3k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
75
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
410
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.7k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.2k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
140
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
Designing for humans not robots
tammielis
254
26k
Transcript
@keke 2019/09/25 Engineer’s Meetup for Students
自己紹介 01 02 03 学生時代のエンジニア経験 2年前のメルカリとの接点からメルペイ入社まで話 What’s SRE メルペイ SREではどんな技術を使って、どんなことをしてるの?
新卒SREは日頃、何をしているのか メルペイ SREと自分は何をしてるのか Backend EngineerやML Engineerとかって馴染みあるけど、SREって? 2 Outlines for Today
自己紹介 3
4 Keke (Twitter: @_k_e_k_e) 2017.3 Mercari BOLD Internship in USA
2019.4- Merpay, New Graduate (SRE Team)
5 Mercari Tech Blog
6 Meetup パネラーとして登壇@2019/09/11
7 Meetup GCPUG Yokohama 勤怠を自動化する技術 Ansible Night
2017.3 第一期生 2019.4 BOLD Internship in USA
メルカリ Join メルカリ外で 色々な長期&短期インターン 2019.2 ここで興味が湧き、Joinを検討。 応募する。 メルペイ機能リリース 8 エンジニア経験とメルカリ・メルペイとの接点 (Backend, SRE, iOS, Blockchain, Hardware) 2019.6 メルペイ SRE Join
9 約2年間なにも接点がなかったが、 メルペイリリースのタイミングなどの理由で就職した「母川回帰タイプ」 イラスト: https://en.wikipedia.org/wiki/Chum_salmon#/media/File:Salmo_salar_GLERL_1.jpg エンジニア経験とメルカリ・メルペイとの接点
メルペイのMission、事業内容の共感でき、 業界への世間の注目度が非常に高い点 MercariのSREのプレゼンスは非常に高い点 SREが守る金融事業は 技術レベルの要求が高く、幅広い点 01 02 03 10 なぜ入社したか、3つのPoint
What’s SRE 11
Site Reliability Engineering ・Googleが最初に作ったエンジニアの職種(SRE) “Site Reliability Engineeringとは、ある組織が、組織のシステム、サービスやプロダクト適切な信頼性のレ ベルを勝ち得るまで貢献するエンジニア工学の概念である”
(SRE Essentials https://speakerdeck.com/jhand/sre-essentials?slide=8) 12 What’s SRE
13 What’s SRE 引用: “What’s the Difference Between DevOps and
SRE?” https://www.youtube.com/watch?v=uTEL8Ff1Zvk&list=PLIivdWyY5sqJrKl7D2u-gmis8h9K66qoj&index=2&t=0s
14 What’s SRE 「信頼性は一つの機能」 SLO (サービスレベル目標) とエラーバジェットを元にDeveloperと交渉をする。 例:
99.99%のAvailabilityをSLOとするサービスならば、約4分/月のダウンタイムが許される。 4分を超えるダウンタイムが発生する機能などはSREはリリースを許可しない。 それをソフトウェア的な問題と捉え、改善などをはかる。
15 What’s SRE 詳しく知りたい人へ 『SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム』 https://amzn.to/2Qay281
メルペイ SREと自分は何をしてるのか 16
メルペイ SRE チーム 17
#mercari_merpay_sre_msp Merpay SRE Responsibility • メルペイという金融サービスのReliability • 開発者がReliabilityを実現するための仕組みづくり Projects •
メルペイのインフラの構築・運用 • メルペイのマイクロサービスのReliability(リリース・監視) • メルペイのマイクロサービスのOperationと改善(自動化、ツール化) 参考資料: 「メルペイのマイクロサービスの構築と運用 / Cloud Native Days 2019」
#mercari_merpay_sre_msp マイクロサービスアーキテクチャ 参考資料: 「メルペイのマイクロサービスの構築と運用 / Cloud Native Days 2019」
自分 20
#mercari_merpay_sre_msp My Project Improve Observability • Cloud Spannerのモニタリング • Kubernetesのネットワークスタッツの取得、および可視化
• PagerDutyを使ったオンコール対応の監視 • Terraformによる宣言的なモニタリングダッシュボードの作成 モニタリングダッシュボードにはDatadogを使用
#mercari_merpay_sre_msp 1. Cloud Spannerのモニタリング Cloud Spannerとは • Google Cloud Platformだけで独自に提供されているデータベース
• “グローバルおよびリージョナル アプリケーション データ向けのスケーラブルなフルマネージ ド リレーショナル データベース サービス” 何をしているのか • GAEとCloud Dataflowをあわせたバックアップ運用、およびその監視 • インスタンスやデータベースのリソース監視 • 監視はDatadogを使い、そのDashboardにはTerraformを使用
#mercari_merpay_sre_msp 2. Kubernetesのネットワークスタットの取得、可視化 ネットワークスタットって • ラウンドトリップレイテンシをはじめ、 DNSルックアップ時間やTCPコネクション時間などの 統計情報のこと • 一般的なRPCであるHTTP/1.1
や 、HTTP/2.0の上で構築されているgRPCを対象としてい る なんでしているのか • レイテンシ増加など、ネットワークに関する問題がたまにある ◦ 問題をドリルダウンして、早期の原因特定のため • すべてのPodの実行環境が同環境ではないので、環境ごとの差異を知るため ◦ リージョンやゾーンなどの地理的環境 ◦ ホストのCPUやメモリなどのリソース環境など
#mercari_merpay_sre_msp 日頃、どんな技術を普段使ってる?
15% 35% 50% おおまかに、ここ最近の時間比率 25
#mercari_merpay_sre_msp IT全体で SREはどんどん増えているため 選択肢の一つとして魅力的! なんでも聞いてください :)
(余談) フレックス制について 27
#mercari_merpay_sre_msp 突然ですが... 朝型の人っていますか?
#mercari_merpay_sre_msp フレックス制(コアタイム12:00 - 16:00)は 不安だった...
コアタイム外に予定入ったりするかも? 01 02 タスクで夜遅くまでいないといけなくなる? 30 想定していた主な不安
コアタイム外に予定入ったりするかも? 01 02 ミーティングなど基本は入らない。 適切な理由があれば入ることもあるが、滅多にない。 タスクで夜遅くまでいないといけなくなる? 早急に対応が必要でないときは「これ、明日でいいですよ」など 一言いってくれる人が多い。 フレックス制が広く浸透していると感じている。 31
想定していた主な不安
#mercari_merpay_sre_msp 働きやすい = 生活がしやすい
Thank you! 33 Keke Twitter: @_k_e_k_e