Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
知られざるDMMデータエンジニアの生態 〜かつてツチノコと呼ばれし者〜
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Kei
January 20, 2025
Programming
2.6k
5
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
知られざるDMMデータエンジニアの生態 〜かつてツチノコと呼ばれし者〜
Kei
January 20, 2025
More Decks by Kei
See All by Kei
AI Readyなデータ基盤構築は、なぜ大企業では進みづらいのか ─現場での試行錯誤から考える、乗り越え方のヒント
takaha4k
0
310
2025.11.4 Data Engineering Summit 前夜祭 データエンジニアあるある言いたい
takaha4k
0
70
20240927_bq-sushi-dmm登壇資料
takaha4k
0
15
5兆レコードを超える DMMデータ基盤の開発と運用のリアル
takaha4k
2
36
Other Decks in Programming
See All in Programming
Spring Security 実践 ─ GraphQL APIで実務に役立つ 認証・認可 を学ぶ
wagyu
0
230
作って学ぶ、 JSX (TSX) ランタイムの基本
syumai
7
1.6k
生成AI時代にこそ効くGo | Why Go Works in the Age of Generative AI
mom0tomo
8
3.2k
不変条件と整合性境界—ビジネスが決める設計判断と実現パターン / Invariants and Consistency Boundaries
nrslib
13
4k
AI時代のUIはどこへ行く?その2!
yusukebe
21
7.1k
「エンジニアインターン、どうやって取った?」準備のリアルを語るLT会 Progate BAR
akiomatic
0
130
キャリア迷子上等 ─ "ない道"は自分で作ればいい
16bitidol
3
2.1k
依存関係から依存物へ―Dependencyという言葉の歴史をひも解く
j_lee
0
120
Inside Stream API
skrb
1
710
ADKを使って簡単にAIエージェントを作ってみよう
k1mu21
0
260
TAKTでAI駆動開発の品質を設計する
j5ik2o
6
1.3k
Javaの型とAI時代に型が大事な理由 / java types and type in AI era
kishida
2
130
Featured
See All Featured
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.3k
Side Projects
sachag
455
43k
Scaling GitHub
holman
464
140k
Navigating Weather and Climate Data
rabernat
0
220
How to Ace a Technical Interview
jacobian
281
24k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
370
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.7k
Building Flexible Design Systems
yeseniaperezcruz
330
40k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
720
Done Done
chrislema
186
16k
Into the Great Unknown - MozCon
thekraken
41
2.6k
Building Applications with DynamoDB
mza
96
7.1k
Transcript
© DMM.com 知られざるDMMデータエンジニアの生態 〜かつてツチノコと呼ばれし者〜 datatech-jp Casual Talks #6 2025.1.20 (月)
合同会社DMM.com 開発統括本部データ基盤開発部 高橋 慶
© DMM.com 登壇者 2 高 橋 慶 TAKAHASHI Kei 出身地 兵庫県
相生市(机バンバン市長でおなじみ) 職歴 DMM.com(2024~現在) ← 化学メーカー(2014~2024) 所属 開発統括本部 データ基盤開発部(Manager)
© DMM.com 本LTの狙い 3 datatech-jpに貢献し、 コミュニティを盛り上げていきたい 本LTで何か得るものがあれば、 お土産としてお持ち帰りいただきたい
© DMM.com なぜコミュニティに貢献するのか 4
© DMM.com 前説 5 なぜツチノコなのか
© DMM.com なぜツチノコなのか 6 田籠さんのブログで ”ツチノコ” と言われる (出所) https://tagomoris.hatenablog.com/entry/2013/12/20/123054
© DMM.com なぜツチノコなのか 7 ノリで作った社内専用サイト ”ツチノコブログ” が誤って全公開 偉い人のつぶやきによって拡散されて、DMMのエンジニアはツチノコと認知されるように (出所) https://x.com/dmm_matsue/status/367241690060308481
© DMM.com 前説 8 弊社のデータ基盤と組織について
© DMM.com データ基盤の主な技術・サービス 9 Vertex AI Dataflow Pub/Sub Composer BigQuery
Datastream Looker Dataplex Cloud Build Storage Functions
© DMM.com ぜひDMM insideもご覧いただければ! 10 2024.12.12 DMM INSIDE: https://inside.dmm.com/articles/data-infrastructure-development-department-interview/
© DMM.com 本題 11 ツチノコ(DMMのデータエンジニア)、何やっているの?
© DMM.com バーチャルオフィス 社内ワークフロー・タスクマネジメント コミュニケーション・ミーティング アイディエーション・スプリントイベント ドキュメンテーション・プレゼンテーション コーディング・コードレビュー 検証・本番作業 DMMデータエンジニアの主なツール
12
© DMM.com 13 もっと詳しく生態を知りたいんですけど (ここで10分経過したぐらいだとLT順調)
© DMM.com バーチャルオフィスで何でも議論 14 子どもが産まれたとか、家を買ったとか、設計やコードの疑問点を聞いたりとか
© DMM.com コラボレーションツールによる協働 15 チーミングからデータパイプライン設計、メタデータ戦略、業務フロー見直し、ふりかえりなど
© DMM.com Slackに作業ログ 16 誰が・いつ・何をやっているのかが分かる。 どこで困っているか分かるので、サポートに入りやすい。
© DMM.com ノウハウはConfluenceで整理 17 Slackでは情報が流れてしまうため、 得られた知見はConfluenceで整理して共有
© DMM.com (補足)CI/CD高速化したい背景 毎月約150本のプルリクエストをmainブランチへマージ(※Revertは除く) PRオープンしてから、大体24時間以内にはマージ 18
© DMM.com アラート対応 19 本番環境で発生したエラーを迅速に対応
© DMM.com Lookerダッシュボード監視 20 BigQueryの利用状況を監視して是正依頼
© DMM.com Slack問い合わせ対応 21 BigQueryのエラーに関する問い合わせ BigQueryデータセットへの閲覧権限付与
© DMM.com 新しい技術を検証・導入 22 BigQueryのプレビュー機能 「history-based optimizations」や「Pipe query syntax」 sqruffを検証したところ不安定な挙動のため、
実用化できず (まだ安定していたSQLFluffを導入)
© DMM.com スキルアップ施策、盛りだくさん 23 会社全体で データ基盤ウェビナー データ組織で アジャイルデータモデリング本の輪読会
© DMM.com 会食イベントを毎月やっている 24 経営層↔現場や、他部署↔自部署の良い交流機会となっている
© DMM.com 発表のまとめ 25 前説 • はてなブログとX(旧Twitter)がキッカケで、DMMはツチノコと呼ばれるようになった • DMMデータ基盤は、Google Cloudネイティブなデータ基盤
• あらゆる事業のデータが基盤に集約されており、テーブル約5,000件、約4兆レコードと規模がデカい • DMMデータ組織は、機能別3グループの6チーム(3~5名)構成 • DMM insideで、データ組織が何やっているかシリーズ記事での発信を始めた 本題 • DMMデータエンジニアのツールを紹介 • DMMデータエンジニアの働き方を紹介 • Gatherでワイワイ • Miroでワイワイ • Slackで作業ログ • Confluenceでナリッジ共有 • アラート対応・Lookerダッシュボード監視・問い合わせ対応 • 毎月約150本のPRの9割を24時間以内にマージ • プレビュー機能やOSSなど新しい技術を検証・導入 • 会社全体や部内でスキルアップ施策いろいろ • 毎月社内で会食イベント(参加無料)
© DMM.com おわりに 26 みんなでdatatech-jpを盛り上げていきましょ! 持ち帰れるものが1つでもあれば幸いです!