Upgrade to Pro — share decks privately, control downloads, hide ads and more …

事例に学ぶ!AWS とCDataSync を使った データ分析基盤の設計から導入効果まで

事例に学ぶ!AWS とCDataSync を使った データ分析基盤の設計から導入効果まで

データ活用が事業成長の鍵となる今日、サイロ化したデータを統合し分析に活用するためのデータ分析基盤の構築が重要性が高まっています。本セミナーでは、Redshiftを用いた分析基盤構築の2つの事例を通じて、その必要性と導入効果を紹介します。さらに、データパイプラインツールを活用することで、分析基盤構築のプロセスがどのように簡単になるのかをご説明します。

CData Sync
https://www.cdata.com/jp/sync/

CData Software Japan

July 18, 2024
Tweet

More Decks by CData Software Japan

Other Decks in Technology

Transcript

  1. 2 About Speaker CData Software Japan の Lead Engineer これまで300種類以上のAPIを見たり触ったりしている

    API中毒な人。 Twitter:@sugimomoto Facebook:sugimomoto Blog:https://www.cdatablog.jp/ Software Design 2022年8月号 Web API 特集 の第1章「Web APIの目的と技術要素 利用者/提供者の利点や技術的なしくみをひも 解く」を執筆 https://gihyo.jp/magazine/SD/archive /2024/202408
  2. 3 このセッションを通じて皆さんに得てほしいこと © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE CData 製品を導入した各社の導入事例を通じて 「各社はどのようにデータ分析基盤の構築とデータ活用の文化づくりに挑んだのか?」 そこに存在した課題・背景・アプローチを理解し、皆さんにも活用してもらえるような エッセンスを持って帰ってもらいたい そして、データパイプラインツールをうまく活用することで、データ分析基盤は意外と手 軽に作り始めることができるということを知ってほしい
  3. 5 製品導入の背景 © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE ユーザー行動分析 CRM 契約管理 プロダクトデータ 会社概要 Developer 向けSaaSを提供するスタートアップソフトウェア企業 対象部門 カスタマーサクセスチーム 対象部門業務内容 お客様の導入フォロー、製品を試用しているが活用できていないお客様の 早期発見や契約後のオンボーディング支援を行うためのチーム 利用サービス PostgreSQL、Airtable、Amplitude、Salesforce、etc..
  4. 6 データ分析基盤構築により解消したかった課題 © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE このお客さんは最近 使ってないけれど、 契約中? それとも 契約切れてる? 以前いつフォローし たかな? フォロー して契約に結びつい たのかな? ・複数ツールに利用状況・契約 内容・サポート内容が分散 ・データの重複やズレ・差分が 発生 ・適切なフォローアップを行う インサイトの取得がスムーズに 実現できていなかった ・チャーン(解約)に繋がるよ うな顧客の即時キャッチアップ の仕組みの構築も難しかった
  5. 7 データ分析基盤構築で意識したポイント © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE 今後の顧客数、顧客デー タ、CS チームのメンバー の成長への対応である 「スケーラビリティ」 顧客のデータを一カ所に 集める 「オブザーバビリティ」 CS メンバーによる顧客へ のアクションと顧客の行 動の変化を記録する 「トレーサビリティ」 サービスとしての成長を考えた際に、顧客の情報を横断で把握し、適切なフォローアップ を行うためのインサイトを得ることができる環境が必要であると考え、データ分析基盤の 構築を決定
  6. 8 データ分析基盤アーキテクチャ © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE 分散された顧客データ・アクティビティに関する情報をデータ分析基盤に集約 カスタマーサクセスに必要なデータを一箇所で確認できるようにダッシュボードを構築 集約データを活用して、チャーン(解約)可能性がある顧客をアラートする仕組みも Alert
  7. 9 導入効果 © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE データ分析基盤構築によりお客様とのあらゆるタッチポイントをデータとして参考 にしながら カスタマーサクセス 業務を行えるように! お客様の満足度の向上・ 継続利用の後押し 主要メンバーの勘や頭の 中にある過去のやり取り の知識で補っていた暗黙 知の明文化 会社全体がデータを基に 行動するというデータカ ルチャーが醸成
  8. 11 背景・ビジネスモデル © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE 学生が参加したイベン トや受講のデータ メールの開封/クリック 状況や、Web ページで の行動履歴 業務・売上データ WebSite・LP アクセスデータ 会社概要 社会人向け経営大学院・ビジネススクールの運営 対象部門 マーケティング部門のCRM・データ活用チーム 対象部門業務内容 デジタルデータの活用による学生のエクスペリエンス向上・新規学生の開拓 利用サービス Salesforce・Marketo・SQL Server・Google Analytics、etc…
  9. 12 課題 © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE ・各地域のキャンパスごとに データが部分最適化・サイロ化 が発生 ・それぞれで独自にダッシュ ボードやレポートを作成 ・データ分析に時間がかかり学 生とのコミュニケーション時間 の捻出に苦戦 ・データのゆらぎ、データ定義 の不一致が経営の妨げに 例えば「体験クラス・説明会の出席率レポー ト」でも、算出方法・母数の考え方が異なり、 結果の捉え方がバラバラに。
  10. 13 データ分析基盤構築のポイント © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE 経営層からの強い コミットメント 1mm の曖昧さもない 見るべき指標の定義 データの品質担保 現場スタッフの 巻き込み 組織横断プロジェクトには、 経営層のコミットメントが必 須。 リーダーから「基本的にExcel のデータはもう見ません。今 後の数値報告はダッシュボー ドで行ってください。」とい う全組織向けのメッセージを 出し、バラバラなレポート・ ダッシュボードが発生する機 会を抑制。データ分析基盤の 活用を組織的に徹底。 「見るべき指標の鳥観図」と 「指標の定義」を作成し社内 Wiki で共有・ディスカッショ ン。どの指標が何処に紐づい ているのかを鳥観図として表 現することで、サービス改善 に向けて追うべき指標同士の つながりや全体像を明らかに。 分析の軸となるべきデータが しかるべきフィールドに入っ ているか、データの重複はな いか、データ同士がしっかり と紐付いているかなど、分析 を阻害するようなデータが生 まれないように事前対策と汚 いデータが発生した時の対処 方法を整理。 「Garbage In, Garbage Out」に ならないビジネスプロセスを 確立。 「鳥観図」、「指標の定義」、 「ダッシュボードのデザイ ン」を決める議論に、必ず現 場のスタッフにも参加。 すべての指標の定義を決めき るのに半年以上かかったが、 ユーザとなる現場スタッフが 「自分が決めた指標の定義」 だと当事者意識をもってもら いやすくなる。
  11. 14 データ分析基盤アーキテクチャ © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE CData+ETL 分散されたマーケティング・学生データ・業務データをデータ分析基盤に集約 経営・各キャンパス運営に必要なデータを一箇所で確認できるようにダッシュボードを構築 見るべき数字・指標を全教員・全キャンパスで共有できる仕組みに
  12. 15 導入効果 © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE 全社向けのデータ基盤の 再構築、見るべき指標の 再定義、脱Excel により データ経営を実現。 キャンパスごとにサイロ 化されていたデータが、 全キャンパス横断で最適 化され、同じ指標・数値 を基に効率的かつ効果的 な運営が可能に。 データ連携処理・レポー ト作成の省力化により、 「人」が行うべき仕事に リソースが集中できるよ うに。
  13. 17 CData Sync 選定ポイント © 2024 CData Software Inc. —

    CONFIDENTIAL – DO NOT DUPLICATE OR DISTRIBUTE 自社で使っているSaaS や RDB などサービスに対応 するコネクタが数多く完 備されていたこと 顧客情報などの自社サー ビスデータはセキュリ ティ・ガバナンスの関係 上、自社でコントロール したいため、自社ホス ティングできるツールで あったこと 課金体系がリクエスト数 やレコード数の従量課金 ではなく、サーバー課金 であったこと
  14. 19 データは「分析・活用」するまでの準備作業が長い © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE 「データ準備80%、データ分析20%」と言われており、 データ分析前段階作業に時間を取られている。 この部分の割合を逆転させ、分析や活用に割り当てられるようにするべき データ 収集 データ 加工 データ 分析 データ 活用
  15. 20 © 2024 CData Software Inc. — CONFIDENTIAL – DO

    NOT DUPLICATE OR DISTRIBUTE 企業のデータ収集及び活用の状況 DX時代のデータマネジメント大全 DX、データドリブン経営、データ利活用から理解する https://www.amazon.co.jp/gp/product/B0BWR4PTQP/ref=ppx_yo_dt_b_d_asin_title_351_o06?ie=UTF8&psc=1 日本はそもそもデータ 収集、データ蓄積、 データ処理の導入状況 (予定含めて)が3割弱。 米国・ドイツと比較し て半分以下。 データを活用するため の下地が圧倒的に不足 している
  16. 21 私達のゴールはAPI連携やデータの準備ではない データを活用し、ビジネスに活かすこと © 2024 CData Software Inc. — CONFIDENTIAL

    – DO NOT DUPLICATE OR DISTRIBUTE >BI 導入のプロジェクトやBIシステムの構築プロジェクトは、 単にBI ツール を導入 することを目的にしてはいけません。このループを仕組みとして作り上げることを 目的にするべきです。 清水 優吾. Microsoft Power BI入門 BI使いになる!Excel脳からの脱却 (Kindle の位置No.608- 610). 株式会社 翔泳社. Kindle 版. でも、データの準備・API連携がうまくいかないと 分析に行き着く前に止まってしまう 本質に集中するために、ツールを使って楽ができる部分は 楽をしよう