Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
大規模サービス開発におけるデータ運用の傾向と対策
Search
shoei
September 06, 2019
Business
5.1k
4
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
大規模サービス開発におけるデータ運用の傾向と対策
shoei
September 06, 2019
More Decks by shoei
See All by shoei
少数精鋭部隊が生み出す メルカリを加速させる超・実務データ分析
shoei
3
960
Other Decks in Business
See All in Business
kakaopiccoma_engineer_recruitingguide
kakaojapan
2
190
HappyLifeCreators株式会社 会社紹介資料
hlc_recruit
0
180
【結果報告】Claude×Linearで会社のタスク管理をAIにまかせて1ヶ月。業務効率150%向上したが、AIネイティブカンパニーを目指すならもっと「加速への狂気」が必要
nagatsu
1
530
スマートキャンプ株式会社 会社紹介資料 / companydeck
smartcamp
1
4.4k
コーポレートストーリー(新規投資家様向け会社説明資料)
gatechnologies
2
19k
どこまでを引き受けるのか — 変わり続ける役割と、変わらない思考法 / How Much We Take On — Evolving Roles and Enduring Ways of Thinking
nrslib
2
1k
会社紹介資料
nipap
0
350
スマートキャンプ株式会社 会社紹介資料 / companydeck
smartcamp
19
740k
【詳細版】パーソルクロステクノロジー_システムインテグレーション領域のご紹介 / Introduction_of_persol-xtech_gs_es_dx_all
pxt_gs_ssol
1
25k
【サービス資料】toiro BPO.pdf
shiftgroup
PRO
0
400
セーフィー株式会社(Safie Inc.) 会社紹介資料
safie_recruit
7
450k
政策共創事例集2025
polipoli
0
600
Featured
See All Featured
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
240
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.9k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
55k
How to Think Like a Performance Engineer
csswizardry
28
2.7k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
870
How GitHub (no longer) Works
holman
316
150k
GraphQLとの向き合い方2022年版
quramy
50
15k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.9k
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
2k
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
4k
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
210
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
540
Transcript
Copyright © Mercari, Inc. All Rights Reserved. 大規模サービス開発における データ運用の傾向と対策 大規模ゆえの三重苦とその対策について
Shoei@Mercari | Data Analyst Manager
今日の内容
今日の話し 運用 データ環境 組織・文化 分析 今日は分析を支えるレイヤーの話 分析の話はこちらへ 「少数精鋭部隊が生み出す メルカリを加速させる超・実務データ分析」
大規模サービスのデータ三重苦 広い・重い・混沌 WIDE Time Consuming Chaos
自己紹介
Self Introduction Ishida Shoei (twitter : @_ _shoei_ _) Data
Analyst | Mgr @ mercari - Cross UX Team - NPS / RR - Registration Rate iOS Engineer @ eversense - Apps for Woman - Family-friendly Apps Data Engineer @ GENIEE - Datawarehouse for Ads (RTB) - ETL(Large Scale/Distributed) - Analytics Platform - Medium-term management plan ・サービス企画・分析からエンジニアリング ・プレイヤーからマネジメントまで
データ・アナリティクスで担保する分野
データ・アナリティクスが活躍する3つの領域 現在・未来・過去 お客様の行動・事業進捗の把握 UXプランニング・効果予測 施策の効果分析・Pivot提案
メルカリの分析環境
・Google Slide ・Wiki ・Docs ・Slack ・etc 粒度・重要度に応じて <物理環境> 分析環境
思想 : 「生データ全部BQに置いとくからあとはよろしく」 BigQuery Client log Transaction DB 各マイクロサービス ETL Query Data Document ・SpreadSheet ・Python ・Colaboratory ・R ・etc データの加工ツールは個人の自由 Data Analyst
<組織環境> 分析組織の立ち位置 各職能がTeamにアサイン。TeamによってPlanning重視or効果分析重視か、各種重点項目は異なる Engineer Backend / iOS / Android /
QA 売上あげるTeam Designer Product Manager 出品者増やすTeam Analyst Xさん Aさん Hさん Oさん Yさん Bさん Iさん Pさん Zさん Cさん Jさん Qさん 横断的なUX改善Team
<思想> データアナリストのデータに対する考え方 意思決定の目的有りきでデータを活用する 成長戦略 重点項目決定 機能開発 クーポン配信 目的先行型 + Data
な考え方 データ先行型な考え方 + Data + Data + Data + Data 「このデータ、何かに活用できないだろうか」 データ処理を頑張る 出口を探して活用
どこに三重苦が生まれるか?
大規模サービスのデータ三重苦 広い・重い・混沌 WIDE Time Consuming Chaos
データ・アナリティクスが活躍する3つの領域 現在・未来・過去 お客様の行動・事業進捗の把握 UXプランニング・効果予測 施策の効果分析・Pivot提案
大規模サービスのデータ三重苦の出現場所 広いゆえに見落とす 「あれ? その指標xxチームが見てるんじゃな いの?」 お客様の行動・事業進捗の把握 UXプランニング・効果予測 施策の効果分析・Pivot提案 理 想
苦 現 実 重いゆえに遅い 「セグメント切って分析したいけど集計重 い...」 混沌ゆえに漏れる 「えっログ埋め込まないでリリースしてたっ て?えっ」
All We Need is 三重苦の退治
実施した(ている)こと3つをご紹介 広いゆえに見落とす 「あれ? その指標xxチームが見てるんじゃな いの?」 お客様の行動・事業進捗の把握 UXプランニング・効果予測 施策の効果分析・Pivot提案 理 想
苦 現 実 重いゆえに遅い 「セグメント切って分析したいけど集計重 い...」 混沌ゆえに漏れる 「えっログ埋め込まないでリリースしてたっ て?えっ」 ① 横断モニタリング ② 誰でも中間テーブル ③ テスト設計FMT
① 横断モニタリングPRJ 森の中からの脱出⇢人工衛星から森を見る世界へ
・チーム毎のダッシュボードの指標や構成などが独自設計 ・イベントレベルでの行動モニタリングが行われてなかった 問題 : 広いゆえに見落としてしまうこと KGIを各KPIにMECEに分解して全体を(完璧には)モニタリングできていなかった 組織 構造 分析 環境
・全社を横断的にモニタリングする組織の不在 (異常検知への対応) (各チームのデータアナリスト・ PdMが自発的に見ていた )
問題 : 広いゆえに見落としていた事 KGIを各KPIにMECEに分解して全体を(完璧には)モニタリングしていなかった 組織構造 分析環境
KPIが抜け落ちる原因 組織は重点項目毎に切られる ≠ KGIのMECE分解 Engineer Backend / iOS / Android
/ QA 売上あげるTeam Designer Product Manager 出品者増やすTeam Analyst Xさん Aさん Hさん Oさん Yさん Bさん Iさん Pさん Zさん Cさん Jさん Qさん 横断的なUX改善Team え! XX(指標)ってYY(チーム)がみてるんじゃないの!? Aさん
「横断モニタリングPRJ」ご紹介 (一部) Confidential 口頭で説明します
イベントレベルまで詳細なモニタリングダッシュボードを0から作成 横断モニタリングPRJ KGIを各KPIにMECEに分解してサービス全体をモニタリングすることに 組織 対策 環境 対策 アナリストチーム内に、横断的にモニタリングするチームを組成 追えていなかった数字が見え、新たな問題に築けた。(構築中から既に効果あり) 効果
管制塔のように、ディスプレイをオフィス内に並べ事業・顧客体験の数値理解を普及する 今後 (構想)
② 誰でも中間テーブル アナリストが自由にテーブルへ作れる時代へ
独自のセグメント定義の秘伝のタレ的なwith句・クエリが各チームで管理・運用されていた 重いゆえに遅くなっていたこと チーム独自に行動ベースのセグメントを持っているが、毎回集計していてスピード感が出ていなかった 要件 環境 メルカリでは各チームに目的特化の最適な独自セグメントが存在 (これは守りたい) 出品機能強化用セグメント・購入機能強化用セグメント・CRM用セグメント
・Google Slide ・Wiki ・Docs ・Slack ・etc 粒度・重要度に応じて 誰でも中間テーブル 思想
: 「SQL書いたら誰でも中間テーブル作れるよ」 BigQuery Client log Transaction DB 各マイクロサービス ETL Query Data Document ・SpreadSheet ・Python ・Colaboratory ・R ・etc データの加工ツールは個人の自由 Data Analyst 中間テーブル Query Data
オンボーディング資料を作り、ハンズオンを実施 誰でも中間テーブル SQLを書けば毎日中間テーブルが生成・更新されるように 対策 普及 活動 Airflow(Google Composer)を立て、中間テーブルが生成されるスクリプトをテンプレ化 各チームでセグメント資料とデータセットが作られ、分析粒度の詳細化・透明性が向上 (gitでクエリ確認)
(90程のDAG ≒ 中間テーブルが生成されている) 効果
「誰でも中間テーブル」の紹介 口頭説明 社内で実施したオンボーディングスライド の紹介
③ 分析設計の開発フロー組み込み 明示的な開発の一部化
テスト設計 / ログ設計が属人化していて、観点のばらつきが存在していた 混沌ゆえに漏れていたところ 重要なところだけテスト設計やログ設計やればいいでしょ ⇢ 施策だして重要だと気づくパターンも有る 従来 環境 重要だと思う施策のみ、
PdMの判断でBIにテスト設計・ログ設計を確認していた
誰でも中間テーブル SQLを書けば毎日中間テーブルが生成・更新されるように 対策 ・開発フローにテスト設計・ログレビューを必須として組み込み (Project Specに明記) ・テスト設計のフォーマットを用意 ・BI内で数値変動仮説と検証方法をでダブルチェック On Going
効果
効果検証フォーマットの紹介 (一部・ドラフト) sorry secret sorry secret sorry secret Project Spec
にReview項目を追加 Review Formatを定義
これからやること
これからのデータ周りの課題について ・データQA : 中間テーブルと元テーブルの数値があっているかの自動テスト ・体系的な分析用中間テーブル(データマート)の充実化 ・ログ定義情報の可視化とガバナンス ・異常検知の自動化 …. 是非、みなさんの課題と構想を教えて下さい やれることはまだまだあると認識しています
(きっと行きている限り永遠に )
懇親会へ向けて みなさま、各社どんな 課題がありますか? 非常に興味があります。 是非データ活用(基盤周り・分析周り含む )でお困りの方、お気軽に情報交換しましょう!
採用、めっちゃやってます。興味あるかたは気軽に声かけて下さい