Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
大規模データに集まるみんなの負債!との付き合い方
Search
阿部 昌利
August 18, 2024
Technology
1.3k
3
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
大規模データに集まるみんなの負債!との付き合い方
阿部 昌利
August 18, 2024
More Decks by 阿部 昌利
See All by 阿部 昌利
primeNumber DATA MANAGEMENT CAMP #2:
masatoshi0205
1
910
『戦え』と、BQが言っている
masatoshi0205
0
240
室長の逆襲 :データ活用の陣地を増やすためのヒント
masatoshi0205
0
830
全社横断データ活用推進のコツと その負債とのつき合い方
masatoshi0205
0
810
ヤプリ社の症例から考えるtrocco依存症
masatoshi0205
0
210
データドリブン組織の継続的拡大のためのヒント
masatoshi0205
3
1.2k
Yappli Data Hubの顧客データ連携の仕組み
masatoshi0205
0
1.9k
Other Decks in Technology
See All in Technology
RAG を使わないという選択肢
tatsutaka
1
190
Disciplined Vibes: Scaling AI-Assisted Engineering
sheharyar
0
130
2026TECHFRESH畢業分享會 - Lightning Talk - 打造精準高效的 MCP 設計模式與測試實務
line_developers_tw
PRO
0
850
あなたの AI ワークスペースに、 専門コーダーを連れてくる - Amazon Quick Desktop 最新情報
kawaji_scratch
1
130
Agentic Web
dynamis
1
200
AAIFに入ってみた ~内から見えるコミュニティ動向~
sato4
0
160
2026.06.13_AI時代に事業会社が「SIer出身エンジニア」を求める理由 / Why Businesses Seek Engineers with a System Integrator Background in the AI Era
jumtech
0
1.1k
失敗を経て、Harness Engineering で 大切にしたいことを考える / Learning from Failure: What Matters in Harness Engineering
bitkey
PRO
1
320
就職⽀援サービスにおけるキャリアアドバイザーのシフトスケジューリング
recruitengineers
PRO
1
140
2026 TECHFRESH 畢業分享會 - 開發日常大解密!從領域驅動到企業級上線
line_developers_tw
PRO
0
840
AWSシリコン最前線 〜AI時代のチップ選択を読み解く〜
htokoyo
2
490
10倍の生産性を実現するAI駆動並列エージェントのすべて
kumaiu
5
1.4k
Featured
See All Featured
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.9k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
320
Between Models and Reality
mayunak
4
330
Agile that works and the tools we love
rasmusluckow
331
21k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
310
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
410
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
140
How to Talk to Developers About Accessibility
jct
2
230
Raft: Consensus for Rubyists
vanstee
141
7.5k
Transcript
⼤規模データに集まるみんなの負債! との付き合い⽅ ⼤規模データの負債解消への道のり Lunch LT 2024.08.20
<主業> 2011〜2014 2014〜2017 2017 2018〜2020 2020〜 <副業> 2021〜2023 株式会社ヤプリ プロダクト開発本部
データサイエンス室 室⻑ 阿部 昌利 @ABE_Masatoshi データ活⽤組織の ⽴ち上げ期にJOIN (所属部⾨は プロダクト開発、 経営企画、 マーケティング、 新規事業室 など まちまち)
データ負債は⼤きく2種類あると 考えています ⼤規模データの負債解消への道のり Lunch LT
データ基盤⾃体の技術的負債 1 • データのワークフローにおける負債 例)テーブルにパーティションやクラスターを設定しておらず、不要なコストがかかっている 例)集計結果をインサートできるテーブルを洗い替えで更新しており、コストが増え続けている 例)本来マスタで対応すべき箇所を、ハードコーディングしてDRY原則に反している データ基盤に罪はないが、データ基盤で対応が求められる負債 2 •
詳細は次ページ • この負債への対応の仕⽅に正解はない • が、データエンジニアの社内のおけるプレゼンスに影響する • データエンジニアリングのつらみや嬉しみにも影響する ⼤規模データの負債解消への道のり Lunch LT
データ基盤⾃体の技術的負債 1 • データのワークフローにおける負債 例)テーブルにパーティションやクラスターを設定しておらず、不要なコストがかかっている 例)集計結果をインサートできるテーブルを洗い替えで更新しており、コストが増え続けている 例)本来マスタで対応すべき箇所を、ハードコーディングしてDRY原則に反している データ基盤に罪はないが、データ基盤で対応が求められる負債 2 •
詳細は次ページ • この負債への対応の仕⽅に正解はない • が、データエンジニアの社内のおけるプレゼンスに影響する • データエンジニアリングのつらみや嬉しみにも影響する ⼤規模データの負債解消への道のり Lunch LT 今⽇はこちら!
データ基盤に集まる負債例 ⼤規模データの負債解消への道のり Lunch LT <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因>
関係システムの運⽤⽅法が データ活⽤に適しておら ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった <会社の⼒学に起因> ビジネスメンバーの意向が 強く、拙速な拡張を繰り返 した結果、膨⼤な前処理が 必要になってしまった <期待値の乖離に起因> 本来的に⼀致し得ないデー タなのに、⼀致するものと して公開されてしまってい た
データ基盤に集まる負債例 ⼤規模データの負債解消への道のり Lunch LT <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因>
関係システムの運⽤⽅法が データ活⽤に適しておら ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった <会社の⼒学に起因> ビジネスメンバーの意向が 強く、拙速な拡張を繰り返 した結果、膨⼤な前処理が 必要になってしまった <期待値の乖離に起因> 本来的に⼀致し得ないデー タなのに、⼀致するものと して公開されてしまってい た トラッキングの基盤 をGA(UA)から内 製基盤へ BIツールのワークフ ローを刷新。 Salesforceのデータ 転送部分から⼿術 dbtを導⼊して 適切な層で 然るべき処理を実施 カスタマーサクセス 部⾨と連携して、 指標を刷新
だが、これらの負債はチャンスでもある ⼤規模データの負債解消への道のり Lunch LT
負債がチャンスになる例 ⼤規模データの負債解消への道のり Lunch LT • 経済的リソースや⼈的リソースに関 わる負債 • ワークフローの処理の複雑さに関わ る負債
• 数字の正確性や更新性、⼀覧性に関 わる負債 負債の種類 得られるメリット • → 〜円コスト削減しました • 〜⼈⽇削減しました • → 計算速度が爆速になりました • 変更対応が⼀瞬で出来ます • → 信じられる数字をいつでも⼀箇所で • ⾒られるようになりました
負債がチャンスになる例 ⼤規模データの負債解消への道のり Lunch LT • 経済的リソースや⼈的リソースに関 わる負債 • ワークフローの処理の複雑さに関わ る負債
• 数字の正確性や更新性、⼀覧性に関 わる負債 負債の種類 得られるメリット • → 〜円コスト削減しました • 〜⼈⽇削減しました • → 計算速度が爆速になりました • 変更対応が⼀瞬で出来ます • → 信じられる数字をいつでも⼀箇所で • ⾒られるようになりました データエンジニア リングっていいね! という評価
基盤起因ではないのに、 データ基盤で対応が必要な負債 ニーズが実証されているデータ ⼤規模データの負債解消への道のり Lunch LT ≒
負債まで育ったデータ基盤の瑕疵は 解決したもん勝ち (⽬の前の⼈からありがとうをもらえる、職務経歴書にビジネス貢献度合いを描けるようになる、 ビジネスや会社への思いやりがあるキャラになれる、偉い⼈の覚えがよくなる、などなど) ⼤規模データの負債解消への道のり Lunch LT
集まってきた負債と付き合うコツ ⼤規模データの負債解消への道のり Lunch LT ※あくまでも個⼈の体験に基づきます。組織の状況や⼈によって、参考になる/ならないが、かなり分かれると考えます • 負債に優先順位をつける ◦ 私が優先度を⾼くする負債 ▪
⼼が削られる負債や、時間が奪われる負債 ▪ ビジネスインパクトが⼤きい負債 ▪ 経営陣に関わる負債 • 負債をさらに⼤きくする ◦ 可能ならばできるだけあとで解決する。時間が経った⽅が、より良いソリューションが⼿に ⼊っていたり、途中でニーズとともに負債が消滅したりするため。場合によってはリーズナブ ルな⽌⾎対応だけする • 負債をみんなで解決する⽬標として捉える ◦ データ負債は誰かを憎みがち。が、基本的には誰も悪くない。過去の⼈たちが頑張った結 果、たまたま今の状況になっているだけ。だから⼀緒に解決しましょうと持ちかける
負債をチャンスに キャリアアップしていきましょう! ⼤規模データの負債解消への道のり Lunch LT