Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データはこう使う!データモデリングからAI活用につなげる社内ダッシュボード事例
Search
gree_tech
PRO
October 17, 2025
Technology
0
120
データはこう使う!データモデリングからAI活用につなげる社内ダッシュボード事例
GREE Tech Conference 2025で発表された資料です。
https://techcon.gree.jp/2025/session/Short-Session-3
gree_tech
PRO
October 17, 2025
Tweet
Share
More Decks by gree_tech
See All by gree_tech
マネジメントに役立つ Google Cloud
gree_tech
PRO
0
22
今この時代に技術とどう向き合うべきか
gree_tech
PRO
2
2.3k
生成AIを開発組織にインストールするために: REALITYにおけるガバナンス・技術・文化へのアプローチ
gree_tech
PRO
0
120
安く・手軽に・現場発 既存資産を生かすSlack×AI検索Botの作り方
gree_tech
PRO
0
110
生成AIを安心して活用するために──「情報セキュリティガイドライン」策定とポイント
gree_tech
PRO
1
620
あうもんと学ぶGenAIOps
gree_tech
PRO
0
160
MVP開発における生成AIの活用と導入事例
gree_tech
PRO
0
180
機械学習・生成AIが拓く事業価値創出の最前線
gree_tech
PRO
0
160
コンテンツモデレーションにおける適切な監査範囲の考察
gree_tech
PRO
0
90
Other Decks in Technology
See All in Technology
AIと共に開発する時代の組織、プロセス設計 freeeでの実践から見えてきたこと
freee
4
740
[CV勉強会@関東 ICCV2025 読み会] World4Drive: End-to-End Autonomous Driving via Intention-aware Physical Latent World Model (Zheng+, ICCV 2025)
abemii
0
230
国産クラウドを支える設計とチームの変遷 “技術・組織・ミッション”
kazeburo
3
1.4k
クレジットカードの不正を防止する技術
yutadayo
17
7.7k
『HOWはWHY WHATで判断せよ』 〜『ドメイン駆動設計をはじめよう』の読了報告と、本質への探求〜
panda728
PRO
5
2.1k
個人から巡るAI疲れと組織としてできること - AI疲れをふっとばせ。エンジニアのAI疲れ治療法 ショートセッション -
kikuchikakeru
4
1.5k
ECS組み込みのBlue/Greenデプロイを動かしてELB側の動きを観察してみる
yuki_ink
1
120
技術広報のOKRで生み出す 開発組織への価値 〜 カンファレンス協賛を通して育む学びの文化 〜 / Creating Value for Development Organisations Through Technical Communications OKRs — Nurturing a Culture of Learning Through Conference Sponsorship —
pauli
5
440
Rubyist入門: The Way to The Timeless Way of Programming
snoozer05
PRO
7
520
「もっと正確に、もっと効率的に」ANDPADの写真書き込み機能における、 現場の声を形にしたエンハンス
andpad
0
110
2ヶ月で新規事業のシステムを0から立ち上げるスタートアップの舞台裏
shmokmt
0
220
LINEヤフー バックエンド組織・体制の紹介
lycorptech_jp
PRO
0
810
Featured
See All Featured
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.5k
Build The Right Thing And Hit Your Dates
maggiecrowley
38
2.9k
Designing for humans not robots
tammielis
254
26k
Visualization
eitanlees
150
16k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.5k
Git: the NoSQL Database
bkeepers
PRO
432
66k
We Have a Design System, Now What?
morganepeng
54
7.9k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.8k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.7k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
Become a Pro
speakerdeck
PRO
29
5.6k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
192
56k
Transcript
データはこう使う!データモデリング からAI活用につなげる社内ダッシュ ボード事例 株式会社グリー エンジニア 遠藤高明
遠藤 高明 2011年にグリー株式会社(現:グリーホールディング ス株式会社)へ入社。ソーシャルゲーム開発や分析基 盤開発/運用、NFTアートのECサイト構築などを経て 現在社内データの集計とデータ利用促進に従事。 妻と娘(3歳)と3人暮らし。2024年に茅ヶ崎に家を建て ました。サーフィンとか湘南らしい趣味はありません が、去年湘南国際マラソンに出て完走しました。 株式会社グリー
エンジニア 2
目次・アジェンダ • プロジェクトの背景と変遷 • データモデリング • 集計処理の変遷 • AI/ML活用と今後 3
プロジェクトの背景と変遷 • プロジェクト ◦ バラバラに管理されていた各種予実管理データをBigQueryに集約してLooker Studioで KPIを可視化する ▪ 具体的には… •
サーバー費の日次の集計と可視化 • 部署のPL収支の可視化 • etc… • 2023年秋開始 ◦ 大きく分けて3つのレポートを作成するという内容 ◦ キックオフの第一印象は集計クエリを数個作ればいいのかなくらいの印象だった 4
プロジェクトの背景と変遷 • 実際… 5 キックオフ時の想定 実際の対応内容 集計クエリの数 7, 8個くらい多くて10個 本番環境と開発環境合わせて30個
マスタデータ 5個 運用のことも踏まえて18個のマスタ データとして切り出す その他の雑務 全く考えておらず 入力用スプレッドシートの自動作成 AppScriptなどなど
プロジェクトの背景と変遷 • 2023年末リリース ◦ 社内のインフラ部向けリリース • 2024年 ◦ 社内で様々な部署に公開 ◦
AI活用も検証開始 • 2025年 ◦ 開発/運用を通して課題となっていたポイントの改善を目的として大幅な処理のリファク タリング ◦ AI/MLを使った機能のリリース 6
データモデリング ERモデリングとディメンショナルモデリング 7
ERモデリング • 特徴 ◦ データを3つに分類 ▪ エンティティ ▪ リレーションシップ ▪
属性 ◦ 正規化 • OLTP(OnlineTransactionProcessing)におけるERモデリングの利点 ◦ 書き込みトランザクションの効率化 • DWH(DataWarehouse)におけるERモデリングの欠点 ◦ 正規化によってテーブルや結合のパスが増えて、SELECT効率が悪くなる ◦ データ出力のためのクエリが複雑になり、正しい出力が難しくなる ◦ 履歴を残せない 8
ディメンショナルモデリング • 特徴 ◦ ビジネスプロセスのデータを2つに分類 ▪ 指標(ファクト) ▪ 説明(ディメンション) ◦
ディメンジョンはファクトのフィルタリング、グループ化、集計に使用 • DWH(DataWarehouse)におけるディメンショナルモデリングの利点 ◦ クエリパフォーマンスと利便性 • 簡単な例 9 時間 ディメンション 製品名 ディメンション 場所 ディメンション 売上 ファクト 2025/10/17 クリノッペ 東京 10,000円 2025/10/18 ドリランド 神奈川 20,000円
データモデリングの成功の背景 • ベースのデータモデルが既にBEAMを意識したものになっていた ◦ BEAM ▪ Business Event Analytics &
Modeling ◦ 7Wを使うことでステークホルダー全員がディメンショナルに考えられるようにする ▪ Who:誰が ▪ What:何を ▪ When:いつ ▪ Where:どこで ▪ Why:なぜ ▪ How:どのように ▪ HowMany:どれくらい ◦ 必要なレポートを7Wでまとめることで、ビジネスプロセスそのものをデータとしてまとめ ることができる 10
BEAMテーブルの例 11 日付 (When) 会計年度 (When) 四半期 (When) 部名 (Who)
統制科目 (What) 収支科目 (What) 費目 (What) 予算 (HowMany) 実績 (HowMany)
データモデリングについての参考書籍 • アジャイルかどうかを置いておいても、データ分析の データモデリングについて非常に勉強になる • 再現性高く良いモデリングを行うために、知識を体系的 に身につけておくのに良いと思います 12 出典:『アジャイルデータモデリング 組織にデータ分析を広めるためのテー
ブル設計ガイド』 ローレンス・コル / ジム・スタグニット[著], 株式会社風音屋[監訳], 打出紘基/ 佐々木江亜/ 土川稔生 / 濱田大樹 / 妹尾拡樹 / ゆずたそ[翻訳]
集計処理の変遷 13
プロジェクト開始時の想定 14
リリース時: Workflowsでオーケストレーション 15
開発/運用していくにつれて顕在化した課題 16 課題 概要 変更管理が属人的 いつどんな変更を加えたのかSlackや(書いていれば)ド キュメントを追わないと分からない 状態管理が属人的 仕様変更など加えた場合、クエリがどんな状態(変更前 か後か)かの把握が属人的
集計クエリが開発/本番で別れていて冗長 開発用/本番用データセット用にそれぞれ集計クエリが 存在する
現在: DataFormで課題を解決 17
集計処理before/after 18 プロジェクト開始時 現在
AI/ML活用と今後 19
AI活用で誰でもデータを扱えるように • BigQuery in Geminiを使って自然言語でクエリ作成 ◦ 今までクエリ作成力がないとデータを扱えなかった人でもデータを扱えるようになった • DataCanvasを使って複雑なクエリでも少しずつ構築できるように! ◦
視覚的に順を追ってクエリを作成できる ◦ ツリー状に作成したクエリは一時テーブルとして参照可能 ◦ BigQuery in Geminiを使うことで自然言語でクエリの構築が可能 • 自然言語でクエリ作成の例 ◦ 20 -- ID_manage_CDNマスタのプロジェクトIDが1つ以上あるプロジェクトID毎にプロ ジェクトIDの合計数を教えて下さい SELECT project_id, count(project_id) FROM `mst_id_manage_cdn` GROUP BY 1 HAVING count(project_id) > 1;
AI活用で誰でもデータを扱えるように • レポートなどの定型業務はスプレッドシートのGemini in Google Spreadsheetsも活用 ◦ スコープを限定できる ◦ 見出し行を条件を指定すればいいのでデータの抽出方法が推測できる
◦ ピボットテーブルを使って集計もできるので、Geminiが返したデータの検証もスプレッド シート内で完結できる 21
簡単MLで異常値検知 • BigQuery MLで簡単にモデル作成 ◦ SQLのみでモデルの作成と評価ができる ▪ モデルの作成のクエリ ▪ モデルの評価のクエリ
◦ 簡単な異常検知であればものの数分で作成可能 ▪ WorkflowsやCloud Run functionsなどと連携することでSlack通知もできる 22
今後の課題 • AIにメタデータを学習させて、自然言語のオーダに正確にアウトプットを 返せるようにする ◦ Dataplex Universal Catalogを使ってビジネスメタデータを設定して学習 ▪ データの中身はAIが分かるように、方言(社内や部署内でしか通じない表現)などはなるべく避けて
一般的なものにするべき ◦ ビジネス用語集を設定/運用して用語の定義を一元管理するのと同時に、ビジネス理解の属 人化やドキュメント作成地獄からの脱却を目指す ▪ 「ドキュメントは腐る」という名言(迷言?)もちらほら見かけますよね… 23
ご清聴ありがとうございました 24
None