Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Data Platform
Search
Yuki
August 21, 2020
Technology
490
1
Share
Data Platform
8/22日に開催したDMM meet upでの資料です。
Yuki
August 21, 2020
More Decks by Yuki
See All by Yuki
データ分析基盤の信頼を支える視点と設計
yuki_saito
2
760
唯一の“源泉”を創るデータ統合プロジェクトのリアル
yuki_saito
1
910
改訂新版 データ分析基盤入門
yuki_saito
7
850
品質特性から眺める データ分析基盤入門
yuki_saito
4
510
データエンジニアと作るデータ文化
yuki_saito
5
3.2k
Pythonとsparkで学ぶpyspark 速習講座
yuki_saito
2
290
AWS データレイク事例祭り 登壇資料
yuki_saito
8
4k
ミライのデータエンジニア
yuki_saito
1
1k
Other Decks in Technology
See All in Technology
プラットフォームエンジニア ワークショップ/ platform-workshop
databricksjapan
0
120
Javaで学ぶSOLID原則
negima
1
230
【ハノーバーメッセ振り返りイベントat名古屋】データは集約からAI起点の収集に ~組織内・組織間でのデータ連携~
tanakaseiya
0
140
コードレビューを制するチームがソフトウェアデリバリーのフローを制す / Beyond Code Review: Distributing Its Responsibilities Across the SDLC
mtx2s
1
340
Generative UI × A2UI で AI エージェントを作った話 AI-DLC も使ってみた!
kmiya84377
1
270
20260528_生成AIを専属DSに_Howの次にすべきことを考える
doradora09
PRO
0
250
Dynamic Workersについて
yusukebe
1
390
「使われるデータ基盤」を目指してデータアナリストとワークショップをやった話
jackojacko_
2
920
AIガバナンス実践 - 生成AIコネクタのデータ漏洩リスクと実務対策
knishioka
0
130
イベントで大活躍する電子ペーパー名札 〜その3〜 / ビジュアルプログラミングIoTLT vol.23
you
PRO
0
160
JEP 522 Deep Dive - G1 GC同期コスト削減によるスループット向上を徹底検証&解説
tabatad
1
310
AI時代に改めて考える、ドメイン駆動設計 - モデリングが「AIへの共通言語」になる
littlehands
8
2.9k
Featured
See All Featured
Measuring & Analyzing Core Web Vitals
bluesmoon
9
840
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.4k
Reality Check: Gamification 10 Years Later
codingconduct
0
2.2k
Accessibility Awareness
sabderemane
1
130
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
560
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
1
240
How Software Deployment tools have changed in the past 20 years
geshan
0
34k
KATA
mclloyd
PRO
35
15k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
140
Designing for Performance
lara
611
70k
Optimizing for Happiness
mojombo
378
71k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.4k
Transcript
© DMM.com Data Platform データ本部 データインフラ部 DREグループ 斎藤 友樹 1
© DMM.com 斎藤 友樹 (サイトウ ユウキ) 2児のパパ 一年くらい前にふらりと入社 子供と遊ぶのが好き リモートになって生産性爆上がり
twitter @yuki_saito_en(前職では禁止されてた) 2 自己紹介 第2子 わたし 奥さん 第1子
© DMM.com ちょっと前の話 BQ.BQ.BQ. BQ
© DMM.com ここまでの長い旅路は省略 データ基盤はAWSに決めました 「Amazon Web Services、“Powered by AWS”ロゴ、[およびかかる資料で使用されるその他のAWS商標] は、米国その他の諸国における、
Amazon.com, Inc.またはその関連会社の商標です。」
© DMM.com AWSで作り込んでいる途中(行動ログAPIはGCP) 「Amazon Web Services、“Powered by AWS”ロゴ、[およびかかる資料で使用されるその他のAWS商標] は、米国その他の諸国における、 Amazon.com,
Inc.またはその関連会社の商標です。」
© DMM.com データの活用を強制すべく DRE (6名,途中から7名) の戦いをいくつか紹介
© DMM.com 取組み No.1 行動ログAPI クラウド化 DONE
© DMM.com prd #E8EAF6 行動ログ VS DRE 2020 1Q eagle-api
Kubernetes Engine Cloud Load Balancing Cloud DNS Cloud Bigtable data pipeline Cloud Pub/Sub Cloud Dataflow Cloud Storage on-premises hq Kubernetes cluster ML Real-time ML Business Analysis Logging Cloud Dataflow
© DMM.com 行動ログ VS DRE 比較表 ただリリースに際して色々やらかしたのはナイショ デプロイ回数 rps コミュニケーション
コスト with 他部 旧シス テム 0 謎 jenkins でざわざわ 10,000くらい(風の噂) 10h/week 新シス テム たくさん github actions でちょちょいと 20,000まで確認済み 0~2h/month
© DMM.com 取組み No.2 オンプレお掃除大作戦 ~ almost DONE ~
© DMM.com オンプレサーバ VS DRE 2019 3Q 172 などなど。。。。 これらの組み合わせにより構成された10を超え
る人智を超越したプロダクト軍 (本番のみ) * 2 * 2 * 2
© DMM.com オンプレサーバ VS DRE 2019 4Q end 65 なんとか普通くらいに
持ってきたぞ。 (本番のみ) * 2
© DMM.com オンプレサーバ VS DRE 2020 2Q~3Q 10 (くらい。たぶん) 他事業部のオンプレ資産活用
ための最低限の構成に (本番のみ)
© DMM.com 取組み No.3 データより大きいデータ。メタデータ拡充 ~ just getting started~
© DMM.com メタデータ VS DRE 2019 4Q end No メタデータ
提供ありなし 1 ビジネスメタデータ あり(保守性に難) 2 テクニカルメタデータ なし 3 データ品質 なし 4 データプロファイリング なし
© DMM.com メタデータ VS DRE 2020 2Q No メタデータ 提供あり/なし
1 ビジネスメタデータ あり(保守性に難) 2 テクニカルメタデータ なし 3 データ品質 あり(ほんの一部) 4 データプロファイリング なし
© DMM.com ありがとうございました!