Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
モダンデータスタック (MDS) の話とデータ分析が起こすビジネス変革
Search
suto
December 10, 2025
Technology
0
600
モダンデータスタック (MDS) の話とデータ分析が起こすビジネス変革
登壇資料:TohokuTech#7「あなたの会社のデータ分析、聞かせてくれませんか?」
suto
December 10, 2025
Tweet
Share
More Decks by suto
See All by suto
DevelopersIO2023「Amazon DataZoneを触ってみた」
sutotakeshi
0
1.7k
re:Growth2022「Analytics系アップデートまとめ」
sutotakeshi
0
790
OSSデータカタログツール「DataHub」を触ってみた
sutotakeshi
0
5.9k
Glue DataBrewでデータを クリーニング、加工してみよう
sutotakeshi
0
8.1k
Other Decks in Technology
See All in Technology
AWSと生成AIで学ぶ!実行計画の読み解き方とSQLチューニングの実践
yakumo
2
530
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.5k
スクラムを一度諦めたチームにアジャイルコーチが入ってどう変化したか / A Team's Second Try at Scrum with an Agile Coach
kaonavi
0
240
Scrum Guide Expansion Pack が示す現代プロダクト開発への補完的視点
sonjin
0
670
善意の活動は、なぜ続かなくなるのか ーふりかえりが"構造を変える判断"になった半年間ー
matsukurou
0
520
次世代AIコーディング:OpenAI Codex の最新動向 進行スライド/nikkei-tech-talk-40
nikkei_engineer_recruiting
0
150
【Agentforce Hackathon Tokyo 2025 発表資料】みらいシフト:あなた働き方を、みらいへシフト。
kuratani
0
120
Databricks Free Editionで始めるLakeflow SDP
taka_aki
0
110
Node vs Deno vs Bun 〜推しランタイムを見つけよう〜
kamekyame
1
490
Databricks Free Edition講座 データエンジニアリング編
taka_aki
0
2.7k
SES向け、生成AI時代におけるエンジニアリングとセキュリティ
longbowxxx
0
320
「違う現場で格闘する二人」——社内コミュニティがつないだトヨタ流アジャイルの実践とその先
shinichitakeuchi
0
390
Featured
See All Featured
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.3k
Designing Experiences People Love
moore
143
24k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
120
Building a Modern Day E-commerce SEO Strategy
aleyda
45
8.5k
The Language of Interfaces
destraynor
162
26k
How to train your dragon (web standard)
notwaldorf
97
6.5k
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
My Coaching Mixtape
mlcsv
0
23
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
0
1.1k
Discover your Explorer Soul
emna__ayadi
2
1k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
40
Statistics for Hackers
jakevdp
799
230k
Transcript
データを「ただの資産」から 『羅針盤』 へ モダンデータスタック (MDS) の話と データ分析が起こすビジネス変⾰
データ分析業務プロセスについて データ分析基盤(モダンデータスタック含む)のサービス全般の概要 話すこと 話さないこと 各サービスごとの詳細な使い方
自己紹介 氏名 須藤 健志 (すとう たけし) 所属 クラスメソッド株式会社 データ事業本部 主な担当 データ分析基盤の構築 データマネジメントの支援
趣味 ボウリング 認定・スキル • 2023 Japan AWS Top Engineers (Analytics) • 2025 Japan AWS All Certifications Engineers • 2025 Google Cloud All Certification Holders • Tableau ◦ Desktop Specialist ◦ Data Analyst ↓ブログURL
1. なぜ今、データ基盤の話をするのか?
課題1: データのサイロ化 「営業データはSalesforce、 マーケはMarketo、経理は ERP…データがバラバラで繋が らない」 課題2: データの遅延と信頼性 「最新の売上レポートが⾒たい のに、出てくるのは翌⽉10⽇」
「営業部とマーケ部で『売上』 の数字が違う」 課題3: 専門家への依存 「ちょっとした分析がしたいだ けなのに、IT部⾨や分析官への 依頼が必要。すぐに対応しても らえない」 「データはあるが、使えない」という現実
もし、全社の信頼できる最新データが、 リアルタイムで、誰でも簡単に見られたら? もし、データが「過去の記録」ではなく 「次にとるべき行動」を教えてくれたら? → それを実現する”⼿段”が「最新データ分析基盤 (MDS)」です。 " " "
"
2. MDS (モダンデータスタック )とは?
クラウドネイティブなサービスで構成されたデータ分析基盤 MDSの全体像
ELT (抽出→ロード→変換)による柔軟性: データを⼊れた「後」で、ビジネスニーズに合わ せて⾃由に加⼯ (T) できる。 スピードと拡張性: クラウドネイティブで処理が⾼速。容量を気にしない。 接続性: 必要なツールを「プラグイン」のように⾃由に組み合わせられる。
✓ ✓ ✓ MDSの主な特徴
3. MDSアーキテクチャについて
誰にとっても ベストなデータ分析基盤( MDS) ってある?
• お客様の要件による • 数年ごとにトレンドが変わる
ソリューションパターン 導入コストはトレードオフ OSSや無料ツール: インフラ構築‧管理の⼿間があり、運⽤負荷が⾼ くなる 有償のSaaS: ノーコード等で運⽤負荷が低く、機能が充実 構築のポイント : サービス選定と費用
AWS / Google Cloudネイティブ: 各サービス仕様とコード開発⾔語の学習が必要 SaaS中⼼のMDS: 機能充実でインフラ管理やコード開発を気にしな くてよいが、ライセンス料⾦など費⽤が⾼い DWHかレイクハウスか: DWH: 構造‧半構造化データのみ、SQL利⽤ レイクハウス: ML中⼼、⾮構造化含むデータの範囲 と量が⼤規模
Before: メッシーデータ (Messy) ‧列名が値になっている (例: 4⽉売上, 5⽉売上) ‧1セルに複数値が混在 ‧集計と⽣データが混在 After:
整然データ (Tidy) ‧1変数が1列、1観測が1⾏ ‧変数を「列」に、値を「⾏」に持つ (縦持ち) ‧DWH/BIでの分析に最適な形式 構築ポイント : 分析しやすい「整然データ」とは?
ブロンズ (Bronze) すべてのソースシステムから取り 込んだ⽣データの層。変更は加え ない。 シルバー (Silver) クレンジング、重複排除、SCD Type2などの履歴管理を⾏った 層。信頼できるデータソース。
ゴールド (Gold) ビジネス要件に基づき、集計やモ デリングを⾏った分析特化テーブ ルの層。BIやMLが利⽤する。 構築ポイント : テーブル設計 (メダリオンアーキテクチャ )
データ分析基盤( AWSネイティブなら) 代替: dbt Airflow 代替‧併⽤: Fivetran trocco Airbyte など
データ分析基盤( Google Cloudネイティブなら) 代替‧併⽤: Fivetran trocco Airbyte など 代替: dbt
モダンデータスタック( SaaS中心) 代替‧併⽤: 外部の最新モデル 代替‧併⽤: 外部の最新モデル 独⾃モデル
モダンデータスタック(データレイクハウス) 代替: 外部のBIツール 代替: dbt on databricks 代替‧併⽤: 外部の最新モデル
自分の考えるコスパ良さげな アーキテクチャは? (2025年12月)
構成: Snowflake中心のアーキテクチャ 代替: 外部のBIツール 代替‧併⽤: 外部の最新モデル 併⽤: Icebergテーブル 代替: FiveTran
Airbyte
構成: Snowflake中心のアーキテクチャ この構成のメリット SQL中⼼: dbtも含め、Snowflakeのリソース作成もSQL中⼼で開発でき、学習コストが低い。 シームレスな連携: 収集(Snowpipe), DWH, ML, ⽣成AI(Cortex),
カタログ(Horizon)がプラットフォーム内で完結。 DevOps: GitリポジトリとのAPI統合で、コード管理やCI/CDが容易。 ✓ ✓ ✓
dbt project on Snowflake(2025/11/06 GA) Snowflake上にdbt構築: dbt coreのインフラ管理が削減。ワークスペース内でdbt開発‧デプロイが可能 Snowflake上でデータパイプライン実⾏: Snowflakeタスクからdbtコマンドの実⾏ができる
Git連携: Gitリポジトリとの連携設定によって、CI/CDも実現可能 ✓ ✓ ✓
4. 分析を「ビジネス価値」に つなげるには?
ビジネス課題の洗い出し 何を解決したいのかを明確にする。 分析のためのストーリー⽴て 課題解決のために、どのデータをどう分析‧可視化するかの仮説を⽴てる。 必要なデータソースのリスト化 仮説検証に必要なデータがどこにあるか、⾜りているかを確認する。 「整備されたデータ」の作成 (MDSの運⽤) 分析しやすいゴールドテーブルを設計し、運⽤する。 分析の実⾏とフィードバック
BIやMLで分析し、ビジネス上の⽰唆を得る。 「BIダッシュボードを作ること」をゴールにしてはいけない。 最も重要なのは「課題設定」と「分析のストーリー⽴て」です。 成功のためのプロセス
5. MDSがビジネスを 「どう変える」か?
Before ‧勘と経験、そして「古い」データに基づいた⽉次の 意思決定会議。 ‧部署ごとに「売上」の定義が異なり、数字の突き合 わせに時間がかかる。 After (MDS) ‧経営層がBIツールで全社の最新KPIを「リアルタイ ム」で把握。 ‧全社共通の定義(セマンティックレイヤー)で「数
字が合わない」不⽑な議論がゼロになる。 変化1: 意思決定が「速く」「正しく」なる
Before ‧データが欲しい現場(営業‧マーケ)と、リソース 不⾜で対応しきれないIT部⾨との間に対⽴が⽣まれ る。 ‧簡単な集計にも数⽇間の待機が発⽣。 After (MDS) ‧IT部⾨は「信頼できるデータ基盤(ゴールド層)」 の整備に集中。 ‧現場担当者は、整備されたデータを使い、IT部⾨に
依頼せずとも⾃分で分析‧集計できる(セルフサービ ス分析)。 変化2: 現場が「自律的」になる (データの民主化 )
Before ‧データは「BIダッシュボードで⾒て終わり」。 ‧分析結果が現場の「次の⾏動」に繋がらず、宝の持 ち腐れになっている。 After (MDS) ‧DWHで分析した「解約しそうな優良顧客リスト」 を、⾃動でSalesforceに戻し、営業担当にアラートを 出す(リバースETL)。 ‧業務プロセス⾃体が賢くなる。
変化3: 業務が「賢く」なる (データのアクティベーション )
Before ‧AI/MLプロジェクトが「実験」⽌まり。 ‧AIの精度を上げるためのデータ収集やクレンジング (前処理)に⼯数の8割が割かれる。 After (MDS) ‧全社のクリーンなデータ(シルバー/ゴールド層)が Snowflakeに集約されており、AIの学習がすぐに始め られる。 ‧Snowflake
Cortexで、顧客レビューの感情分析や社 内⽂書のRAG構築がSQLで実現可能に。 変化4: AIが「実用的」になる (生成AI/MLの加速)
6. まとめ
ビジネス課題の洗い出し 何を解決したいのかを明確にする。 分析のためのストーリー⽴て 課題解決のために、どのデータをどう分析‧可視化するかの仮説を⽴てる。 必要なデータソースのリスト化 仮説検証に必要なデータがどこにあるか、⾜りているかを確認する。 「整備されたデータ」の作成 (MDSの運⽤) 分析しやすいゴールドテーブルを設計し、運⽤する。 分析の実⾏とフィードバック
BIやMLで分析し、ビジネス上の⽰唆を得る。 「BIダッシュボードを作ること」をゴールにしてはいけない。 最も重要なのは「課題設定」と「分析→アクションのためのストーリー⽴て」です。 成功のためのプロセス
MDSによるデータ分析がもたらすもの MDSは単なるITインフラの刷新ではありません。 それは、「ビジネスのやり⽅」そのものを変⾰す る(=トランスフォーメーション)ためのエンジ ンです。 意思決定の⾼速化、業務の⾃動化、そして「全社 的なデータ⽂化」の醸成に繋がります。 クラスメソッドは支援できます まずは「⾃部⾨の最も解決したい課題」からス モールスタートしませんか?
• 解決したい課題は何なのか定義 • どんなデータが必要か棚卸し • 基盤構築に加えテーブル設計もセットで MDSがもたらす未来と、次のステップ
ご清聴ありがとうございました