Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
大規模データに集まるみんなの負債!との付き合い方
Search
阿部 昌利
August 18, 2024
Technology
1.3k
3
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
大規模データに集まるみんなの負債!との付き合い方
阿部 昌利
August 18, 2024
More Decks by 阿部 昌利
See All by 阿部 昌利
primeNumber DATA MANAGEMENT CAMP #2:
masatoshi0205
1
910
『戦え』と、BQが言っている
masatoshi0205
0
240
室長の逆襲 :データ活用の陣地を増やすためのヒント
masatoshi0205
0
830
全社横断データ活用推進のコツと その負債とのつき合い方
masatoshi0205
0
810
ヤプリ社の症例から考えるtrocco依存症
masatoshi0205
0
210
データドリブン組織の継続的拡大のためのヒント
masatoshi0205
3
1.2k
Yappli Data Hubの顧客データ連携の仕組み
masatoshi0205
0
1.9k
Other Decks in Technology
See All in Technology
2026TECHFRESH畢業分享會 - Lightning Talk - 資料也要 CI/CD? 用 Airbyte 自動化資料同步
line_developers_tw
PRO
0
830
機械学習を「社会実装」するということ 2026年夏版 / Social Implementation of Machine Learning June 2026 Version
moepy_stats
4
1.6k
チームで進めるAI駆動アジャイル×ウォーターフォール
kumaiu
0
150
AIっぽい文章を採点して人間らしく直すアプリを作ってみた
yama3133
2
130
SONiC Scale-Up Working Group から探る Scale-UpやUltraEthernet機能の実装方法
ebiken
PRO
2
130
2026TECHFRESH畢業分享會 - 原生還是跨平台? App 開發踩坑實錄
line_developers_tw
PRO
0
850
AmazonRoute 53ではじめてのドメイン取得!HTTPS化までの道のりを整理してみた
usanchuu
3
130
protovalidate-es を導入してみた
bengo4com
0
170
RSA暗号を手計算したくなること、ありますよね?? (20260615_orestudy6_rsa)
thousanda
0
270
新しいVibe Codingと”自走”について
watany
5
300
Kubernetesにおける学習基盤とLLMOpsの概要
ry
1
250
Building applications in the Gemini API family.
line_developers_tw
PRO
0
3.1k
Featured
See All Featured
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
250
Code Reviewing Like a Champion
maltzj
528
40k
Thoughts on Productivity
jonyablonski
76
5.2k
The Pragmatic Product Professional
lauravandoore
37
7.3k
エンジニアに許された特別な時間の終わり
watany
107
250k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
11k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
160
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.3k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
1.1k
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
190
Building Flexible Design Systems
yeseniaperezcruz
330
40k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
160
Transcript
⼤規模データに集まるみんなの負債! との付き合い⽅ ⼤規模データの負債解消への道のり Lunch LT 2024.08.20
<主業> 2011〜2014 2014〜2017 2017 2018〜2020 2020〜 <副業> 2021〜2023 株式会社ヤプリ プロダクト開発本部
データサイエンス室 室⻑ 阿部 昌利 @ABE_Masatoshi データ活⽤組織の ⽴ち上げ期にJOIN (所属部⾨は プロダクト開発、 経営企画、 マーケティング、 新規事業室 など まちまち)
データ負債は⼤きく2種類あると 考えています ⼤規模データの負債解消への道のり Lunch LT
データ基盤⾃体の技術的負債 1 • データのワークフローにおける負債 例)テーブルにパーティションやクラスターを設定しておらず、不要なコストがかかっている 例)集計結果をインサートできるテーブルを洗い替えで更新しており、コストが増え続けている 例)本来マスタで対応すべき箇所を、ハードコーディングしてDRY原則に反している データ基盤に罪はないが、データ基盤で対応が求められる負債 2 •
詳細は次ページ • この負債への対応の仕⽅に正解はない • が、データエンジニアの社内のおけるプレゼンスに影響する • データエンジニアリングのつらみや嬉しみにも影響する ⼤規模データの負債解消への道のり Lunch LT
データ基盤⾃体の技術的負債 1 • データのワークフローにおける負債 例)テーブルにパーティションやクラスターを設定しておらず、不要なコストがかかっている 例)集計結果をインサートできるテーブルを洗い替えで更新しており、コストが増え続けている 例)本来マスタで対応すべき箇所を、ハードコーディングしてDRY原則に反している データ基盤に罪はないが、データ基盤で対応が求められる負債 2 •
詳細は次ページ • この負債への対応の仕⽅に正解はない • が、データエンジニアの社内のおけるプレゼンスに影響する • データエンジニアリングのつらみや嬉しみにも影響する ⼤規模データの負債解消への道のり Lunch LT 今⽇はこちら!
データ基盤に集まる負債例 ⼤規模データの負債解消への道のり Lunch LT <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因>
関係システムの運⽤⽅法が データ活⽤に適しておら ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった <会社の⼒学に起因> ビジネスメンバーの意向が 強く、拙速な拡張を繰り返 した結果、膨⼤な前処理が 必要になってしまった <期待値の乖離に起因> 本来的に⼀致し得ないデー タなのに、⼀致するものと して公開されてしまってい た
データ基盤に集まる負債例 ⼤規模データの負債解消への道のり Lunch LT <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因>
関係システムの運⽤⽅法が データ活⽤に適しておら ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった <会社の⼒学に起因> ビジネスメンバーの意向が 強く、拙速な拡張を繰り返 した結果、膨⼤な前処理が 必要になってしまった <期待値の乖離に起因> 本来的に⼀致し得ないデー タなのに、⼀致するものと して公開されてしまってい た トラッキングの基盤 をGA(UA)から内 製基盤へ BIツールのワークフ ローを刷新。 Salesforceのデータ 転送部分から⼿術 dbtを導⼊して 適切な層で 然るべき処理を実施 カスタマーサクセス 部⾨と連携して、 指標を刷新
だが、これらの負債はチャンスでもある ⼤規模データの負債解消への道のり Lunch LT
負債がチャンスになる例 ⼤規模データの負債解消への道のり Lunch LT • 経済的リソースや⼈的リソースに関 わる負債 • ワークフローの処理の複雑さに関わ る負債
• 数字の正確性や更新性、⼀覧性に関 わる負債 負債の種類 得られるメリット • → 〜円コスト削減しました • 〜⼈⽇削減しました • → 計算速度が爆速になりました • 変更対応が⼀瞬で出来ます • → 信じられる数字をいつでも⼀箇所で • ⾒られるようになりました
負債がチャンスになる例 ⼤規模データの負債解消への道のり Lunch LT • 経済的リソースや⼈的リソースに関 わる負債 • ワークフローの処理の複雑さに関わ る負債
• 数字の正確性や更新性、⼀覧性に関 わる負債 負債の種類 得られるメリット • → 〜円コスト削減しました • 〜⼈⽇削減しました • → 計算速度が爆速になりました • 変更対応が⼀瞬で出来ます • → 信じられる数字をいつでも⼀箇所で • ⾒られるようになりました データエンジニア リングっていいね! という評価
基盤起因ではないのに、 データ基盤で対応が必要な負債 ニーズが実証されているデータ ⼤規模データの負債解消への道のり Lunch LT ≒
負債まで育ったデータ基盤の瑕疵は 解決したもん勝ち (⽬の前の⼈からありがとうをもらえる、職務経歴書にビジネス貢献度合いを描けるようになる、 ビジネスや会社への思いやりがあるキャラになれる、偉い⼈の覚えがよくなる、などなど) ⼤規模データの負債解消への道のり Lunch LT
集まってきた負債と付き合うコツ ⼤規模データの負債解消への道のり Lunch LT ※あくまでも個⼈の体験に基づきます。組織の状況や⼈によって、参考になる/ならないが、かなり分かれると考えます • 負債に優先順位をつける ◦ 私が優先度を⾼くする負債 ▪
⼼が削られる負債や、時間が奪われる負債 ▪ ビジネスインパクトが⼤きい負債 ▪ 経営陣に関わる負債 • 負債をさらに⼤きくする ◦ 可能ならばできるだけあとで解決する。時間が経った⽅が、より良いソリューションが⼿に ⼊っていたり、途中でニーズとともに負債が消滅したりするため。場合によってはリーズナブ ルな⽌⾎対応だけする • 負債をみんなで解決する⽬標として捉える ◦ データ負債は誰かを憎みがち。が、基本的には誰も悪くない。過去の⼈たちが頑張った結 果、たまたま今の状況になっているだけ。だから⼀緒に解決しましょうと持ちかける
負債をチャンスに キャリアアップしていきましょう! ⼤規模データの負債解消への道のり Lunch LT