Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
タイミーのデータモデリング事例と今後のチャレンジ
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Toshiki Tsuchikawa
July 04, 2025
Technology
8
4k
タイミーのデータモデリング事例と今後のチャレンジ
Data Modeling Night -「今」だからできる理論の実践事例 -(
https://pixiv.connpass.com/event/358285/
) の登壇資料
Toshiki Tsuchikawa
July 04, 2025
Tweet
Share
More Decks by Toshiki Tsuchikawa
See All by Toshiki Tsuchikawa
タイミーのデータ活用を支えるdbt Cloud導入とこれから
ttccddtoki
2
1.3k
タイミーにおけるデータ活用の未来
ttccddtoki
0
370
急成長する組織を支えるデータ基盤のこれまで、これから
ttccddtoki
6
880
アジリティの高いデータ基盤を目指して
ttccddtoki
4
1.8k
DMBOKを参考にしたデータマネジメントの取り組み
ttccddtoki
6
3.1k
dbt_Cloudとdbt_Core併用の試み
ttccddtoki
3
1.6k
データ品質を重視したデータ基盤プロダクト開発
ttccddtoki
8
2.5k
タイミーの未来を支えるデータ基盤プロダクト
ttccddtoki
1
1k
datatech-jp Casual Talks #3
ttccddtoki
0
1.2k
Other Decks in Technology
See All in Technology
DEVCON 14 Report at AAMSX RU65: V9968, MSX0tab5, MSXDIY etc
mcd500
0
230
Digitization部 紹介資料
sansan33
PRO
1
6.7k
最速で価値を出すための プロダクトエンジニアのツッコミ術
kaacun
1
410
ゼロから始めたFindy初のモバイルアプリ開発
grandbig
2
530
Regional_NAT_Gatewayについて_basicとの違い_試した内容スケールアウト_インについて_IPv6_dual_networkでの使い分けなど.pdf
cloudevcode
1
190
フロントエンド開発者のための「厄払い」
optim
0
180
新規事業における「一部だけどコア」な AI精度改善の優先順位づけ
zerebom
0
430
【Oracle Cloud ウェビナー】[Oracle AI Database + Azure] AI-Ready データ戦略の最短ルート:Azure AIでビジネス データの価値を最大化
oracle4engineer
PRO
2
140
KubeCon + CloudNativeCon NA ‘25 Recap, Extensibility: Gateway API / NRI
ladicle
0
160
クレジットカード決済基盤を支えるSRE - 厳格な監査とSRE運用の両立 (SRE Kaigi 2026)
capytan
1
250
Databricks Free Edition講座 データサイエンス編
taka_aki
0
250
toCプロダクトにおけるAI機能開発のしくじりと学び / ai-product-failures-and-learnings
rince
6
4.6k
Featured
See All Featured
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
0
300
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.9k
A better future with KSS
kneath
240
18k
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
0
1.1k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
110
YesSQL, Process and Tooling at Scale
rocio
174
15k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.9k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
1
86
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
430
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.4k
Transcript
2025/7/4 土川稔生, 大河戸裕一 タイミーのデータモデリング事例と 今後のチャレンジ @tvtg_24 , @miburo_data Data Modeling
Night -「今」だからできる理論の実践事例 -
自己紹介 土川 稔生 (Tsuchikawa Toshiki) 株式会社タイミーに2020年入社 DRE(Data Reliability Engineering)グループマネージャー 1人目データエンジニアとしてデータ基盤を構築し始める
現在はプロダクトオーナーとして、データ基盤プロダクト作りに 励む
自己紹介 大河戸 裕一 (Okodo Yuichi) スタートアップにてソフトウェアエンジニアを経験後、 1人目データ人材として、データ組織の立ち上げとデータ基盤の 作成を経験 タイミー入社後はアナリストを経験後、データエンジニア兼アナ リティクスエンジニア業務に従事
主にLookerやデータモデリングの開発をリード
Copyright © Timee All Rights Reserved 4 タイミーとは
Copyright © Timee All Rights Reserved 5 タイミーの特徴
Copyright © Timee All Rights Reserved 6 導入実績
あなたの組織では、 データが十分に活用されていますか ??
データは大量にあるが、使いづらい ... データ活用者 大量のデータ
データは大量にあるが、使いづらい ... データ活用者 大量のデータ ほしいデータが入って いるテーブルがわから ない SQLのロジック複雑。A さんに聞かないと 中身編集できない
テーブルたくさんあって SQLがすごく長い
データモデリングのメリット 1. 社内のビジネスドメインをSQL定義に落とし 込んでSSoTとして管理できる! 2. ディメンショナルモデリングにより、SQLを 書く際に直感的に理解しやすいデータ構造に なる! 3. テーブル数や結合が少なくなりSQLがシンプ
ルなり、パフォーマンスも向上する!
タイミーにおけるデータモデリング
タイミーのデータ基盤
タイミーのデータモデリング業務 アナリストの開発領域 データモデラー (DRE G)の開発領域 ここを広げたい!
タイミーのデータモデリング業務 PII情報に対するクエリを承認制にしつつ モデリングに露出させるか整備したり セマンティックレイヤーの命名をユーザー ライクなものにする実装をしたり みたいな領域もデータモデリングという枠組みで行なってます
既存のデータモデリング開発で顕在化した進め方の課題 ユーザーの起票ベースで開 発を行なっていて、Lookerを 使っていない部署の意見が 反映できない。 攻めのデータモデリング が 行えていない。 既に運用に乗っている アナリストが作成したクエリ
(合計2800行ほど)を ディメンショナルモデリングで置 き換える作業 で実装が泥沼化
既存のデータモデリング開発で顕在化した進め方の課題 ユーザーの起票ベースで開発を行なっていて、 Lookerを使っていない部署の意見が反映できない。 攻めのデータモデリング が行えていない。 Lookerの利用率は高いため、 Lookerをすでに使っている部署の改修・追加依頼はたくさん来るが、 データ出力をデータモデリングでカバーできる領域自体を広げる動きには繋がりづらい。 タイミー社内で日常的に生まれる新しい領域や新規プロジェクトに対して先回りして動けておらず、 その領域において非効率なクエリが生産されている状態。
後手後手の依頼対応で意思決定の高速化に貢献できていない状態・・
既存のデータモデリング開発で顕在化した進め方の課題 既に運用に乗っているアナリストが作成したクエリ (合計2800行ほど)をディメンショナルモデリングで置き換える 作業が泥沼化 既存のデータモデリングと同音異義語の指標名や dimension名が多数存在してすり合わせが困難 事業部サイドの要求が反映された複雑で横展開できない特殊定義が多数存在 既存のクエリが正解ではなく間違いなどもあるので正解がなく、一度定まった定義を変更してすり合 わせていく作業が発生 一緒に作っていくプロセスを経ればこんなことは起きなかったのに・・
アジャイルデータモデリングの実践
アジャイルデータモデリング アジャイルデータモデリングのメリット (一部): • 従来の大規模で時間をかけたモデリングではなく、ビジネスニーズに合わ せて段階的かつ柔軟にデータモデリングを構築・改善する • ユーザーとの頻繁なコミュニケーションを通じて、ビジネス側のステークホル ダーと協調しながら要件にあったモデリングを構築できる タイミーにおける課題に対して期待していること:
• 攻めのモデリング : モデリングするべき重要なデータユースケースを把握し ながら、将来的にスケールする分析環境の提供 • 段階的なモデリング : 既存の2800行のクエリを一度に置き換えるのではな く、優先度の高いストーリー、指標から段階的に移行 • ドメイン知識の共通化 : ビジネスユーザーとの頻繁なコミュニケーションを 通じて、モデリングする人とのドメイン知識を共通化することによる属人化の 防止、モデルのメンテ性向上
実際の事例 ①
アジャイルデータモデリング事例 1:進め方 指標Aを全く新しい軸でみたい。今 Lookerでは見れない (=スタースキーマで表現されていない ) 新しいLooker探索環境 (=スタースキーマ )が必要ではないかと考えている 依頼
どういうものをイメージしているのかふ わっとしかわからない つまりどういうことだってばよ・・?
アジャイルデータモデリング事例 1 既存ワイドテーブルをベースにBEAM*テーブルを作る形で 差異を確認。新しく実現したい絞り込みや情報の粒度を確認
アジャイルデータモデリング事例 1 整理を通して既存のDimensionを拡張するだけで実現可能な 項目であることが判明! ふわっとした要件を解像度高く追加実装要件に落とせた
アジャイルデータモデリング事例 1:感想 - 「既存の」ディメンショナルデータモデリングされたテーブルも BEAM*テーブルとして表現可能で、BEAM*テーブルをコミュニケー ションツールとして活用できたこと。 - 「どこが既存との差異なのか」を目線を合わせながらコミュニ ケーションできた。 -
具体のレコードイメージをBEAM*テーブルを通じて作ることができる ので、ふわっとした要求を実装要件に落とし込めるありがたみがわ かった。
アジャイルデータモデリング事例 2 取引先になった後の各種実 績 Salesforceデータをベースに モデリング済み 広告媒体の実績 各種広告ツールで確認でき ている リード
= 見込み顧客 ドメイン的に微妙に浮いてい てモデリングでも未着手状 態 ここ攻められてないから やってみよう マーケの関心領域 セールスの関心領域
アジャイルデータモデリング事例 2:進め方 ①マーケメンバーへの 課題領域ヒアリング ②マーケドメインを担当 するアナリストにヒアリン グ ③ビジネスメンバーとマー ケドメインアナリストへの ヒアリング
アジャイルデータモデリング事例 2:ヒアリング内容 ①マーケメンバーへの 課題領域ヒアリング ②マーケドメインを担当 するアナリストにヒアリン グ 「What」の目安をつける 「リードの数と獲得費用対 効果が知りたい」
「What」以外の実装案を 埋めてワイドテーブルの 仮組をする 仮組みされたワイドテー ブルをベースに 実分析ケースを壁打ち ③ビジネスメンバーとマー ケドメインアナリストへの ヒアリング
アジャイルデータモデリング事例 2:BEAM*の更新 ① ② ③
アジャイルデータモデリング事例 2:BEAM*の更新 ① ② ③ 初回は関心領 域の特定だけ で終わってし まった スタースキーマがわかる
アナリストメンバーと仮組 み 営業メンバーにぶつけ てみて更新 マーケ目線じゃ出て こない情報の更新
アジャイルデータモデリング事例 2 感想・コツ - この本で推奨されている「誰が何をしますか?」 という質問から聞いても答え は得られなかった。「何をみたいですか」 という問い(スタースキーマのファクト を定める質問)をしたら初めてうまくいった という切り出し方をしてもビジネスユーザーはピンとこなかった ソースシステムの処理や挙動を深く理解している人相手なら刺さりそう
アジャイルデータモデリング事例 2 感想・コツ - BEAM*テーブルという中間成果物が何かしら更新されるので、30分や15分の ヒアリング枠を複数設けて少しずつ更新するような進め方 が可能 - なので複数の観点からのレビュー がもらいやすい うちのチームではこの絞
り込みが追加で必要 うちのチームではこの絞 り込みが追加で必要
アジャイルデータモデリング事例 2 感想・コツ • 「本の型通りの質問をしてBEAM*テーブルを作る」ではなく、 「JOIN後のワイドテーブルのレコードを作る 」ってメンタルモデルにしたらヒア リングうまくいった。 要するにスタースキーマを JOINしたワイドテーブルのレ コードイメージを決めればい
いのか。 それならわかるぞ BEAM*テーブルを作るって何 ・・? とりあえず書いてある通りの質 問をしてみよう
2つの事例を通して - 目線を合わせるためのBEAM*テーブルの有用性 - 顧客の要求を実装要件に具体化できる。 - 少しずつアップデートできて、複数の目線を反映させやすい - 当社での苦戦ポイント -
本に記載されているような問いかけはビジネスユーザー相手だと通じ ないことが多かった。(なぜなら具体の処理やデータ間のリレーショ ンや指標の発生タイミングなどをソースシステムの理解を元に話せる 人がほとんどいなかったから) - 当社はLookerの業務活用がかなり浸透しているので、Lookerで 言うとどういう状態ですか?っていうディメンショナルモデリン グの世界感における聞き方もできたのが大きかった。
2つの事例を通して これまでもヒアリングを通して攻めのデータモデリングはし ていたが、うまくできるかどうかは属人性が高かった。 「BEAM*テーブル経由のコミュニケーション」という”型”が できたことで、チームとして設計スキルを手に入れられたの がとても大きい成果!
積極的に採用中です! まだまだ道半ばなのでお力を貸してください!XでのDMもお待ちしてます! https://product-recruit.timee.co.jp/data