Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データはこう使う!データモデリングからAI活用につなげる社内ダッシュボード事例
Search
gree_tech
PRO
October 17, 2025
Technology
0
260
データはこう使う!データモデリングからAI活用につなげる社内ダッシュボード事例
GREE Tech Conference 2025で発表された資料です。
https://techcon.gree.jp/2025/session/Short-Session-3
gree_tech
PRO
October 17, 2025
Tweet
Share
More Decks by gree_tech
See All by gree_tech
変わるもの、変わらないもの :OSSアーキテクチャで実現する持続可能なシステム
gree_tech
PRO
0
2.1k
マネジメントに役立つ Google Cloud
gree_tech
PRO
0
25
今この時代に技術とどう向き合うべきか
gree_tech
PRO
3
2.4k
生成AIを開発組織にインストールするために: REALITYにおけるガバナンス・技術・文化へのアプローチ
gree_tech
PRO
0
150
安く・手軽に・現場発 既存資産を生かすSlack×AI検索Botの作り方
gree_tech
PRO
0
140
生成AIを安心して活用するために──「情報セキュリティガイドライン」策定とポイント
gree_tech
PRO
1
1.3k
あうもんと学ぶGenAIOps
gree_tech
PRO
0
260
MVP開発における生成AIの活用と導入事例
gree_tech
PRO
0
280
機械学習・生成AIが拓く事業価値創出の最前線
gree_tech
PRO
0
200
Other Decks in Technology
See All in Technology
Lessons from Migrating to OpenSearch: Shard Design, Log Ingestion, and UI Decisions
sansantech
PRO
1
110
ガバメントクラウド利用システムのライフサイクルについて
techniczna
0
190
AWS re:Invent 2025で見たGrafana最新機能の紹介
hamadakoji
0
310
乗りこなせAI駆動開発の波
eltociear
1
1.1k
[JAWS-UG 横浜支部 #91]DevOps Agent vs CloudWatch Investigations -比較と実践-
sh_fk2
1
250
EM歴1年10ヶ月のぼくがぶち当たった苦悩とこれからへ向けて
maaaato
0
270
多様なデジタルアイデンティティを攻撃からどうやって守るのか / 20251212
ayokura
0
410
大企業でもできる!ボトムアップで拡大させるプラットフォームの作り方
findy_eventslides
1
690
MapKitとオープンデータで実現する地図情報の拡張と可視化
zozotech
PRO
1
130
5分で知るMicrosoft Ignite
taiponrock
PRO
0
330
[デモです] NotebookLM で作ったスライドの例
kongmingstrap
0
130
非CUDAの悲哀 〜Claude Code と挑んだ image to 3D “Hunyuan3D”を EVO-X2(Ryzen AI Max+395)で動作させるチャレンジ〜
hawkymisc
1
170
Featured
See All Featured
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.5k
Unsuck your backbone
ammeep
671
58k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
700
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
The Cult of Friendly URLs
andyhume
79
6.7k
Designing for humans not robots
tammielis
254
26k
Why Our Code Smells
bkeepers
PRO
340
57k
Into the Great Unknown - MozCon
thekraken
40
2.2k
Transcript
データはこう使う!データモデリング からAI活用につなげる社内ダッシュ ボード事例 株式会社グリー エンジニア 遠藤高明
遠藤 高明 2011年にグリー株式会社(現:グリーホールディング ス株式会社)へ入社。ソーシャルゲーム開発や分析基 盤開発/運用、NFTアートのECサイト構築などを経て 現在社内データの集計とデータ利用促進に従事。 妻と娘(3歳)と3人暮らし。2024年に茅ヶ崎に家を建て ました。サーフィンとか湘南らしい趣味はありません が、去年湘南国際マラソンに出て完走しました。 株式会社グリー
エンジニア 2
目次・アジェンダ • プロジェクトの背景と変遷 • データモデリング • 集計処理の変遷 • AI/ML活用と今後 3
プロジェクトの背景と変遷 • プロジェクト ◦ バラバラに管理されていた各種予実管理データをBigQueryに集約してLooker Studioで KPIを可視化する ▪ 具体的には… •
サーバー費の日次の集計と可視化 • 部署のPL収支の可視化 • etc… • 2023年秋開始 ◦ 大きく分けて3つのレポートを作成するという内容 ◦ キックオフの第一印象は集計クエリを数個作ればいいのかなくらいの印象だった 4
プロジェクトの背景と変遷 • 実際… 5 キックオフ時の想定 実際の対応内容 集計クエリの数 7, 8個くらい多くて10個 本番環境と開発環境合わせて30個
マスタデータ 5個 運用のことも踏まえて18個のマスタ データとして切り出す その他の雑務 全く考えておらず 入力用スプレッドシートの自動作成 AppScriptなどなど
プロジェクトの背景と変遷 • 2023年末リリース ◦ 社内のインフラ部向けリリース • 2024年 ◦ 社内で様々な部署に公開 ◦
AI活用も検証開始 • 2025年 ◦ 開発/運用を通して課題となっていたポイントの改善を目的として大幅な処理のリファク タリング ◦ AI/MLを使った機能のリリース 6
データモデリング ERモデリングとディメンショナルモデリング 7
ERモデリング • 特徴 ◦ データを3つに分類 ▪ エンティティ ▪ リレーションシップ ▪
属性 ◦ 正規化 • OLTP(OnlineTransactionProcessing)におけるERモデリングの利点 ◦ 書き込みトランザクションの効率化 • DWH(DataWarehouse)におけるERモデリングの欠点 ◦ 正規化によってテーブルや結合のパスが増えて、SELECT効率が悪くなる ◦ データ出力のためのクエリが複雑になり、正しい出力が難しくなる ◦ 履歴を残せない 8
ディメンショナルモデリング • 特徴 ◦ ビジネスプロセスのデータを2つに分類 ▪ 指標(ファクト) ▪ 説明(ディメンション) ◦
ディメンジョンはファクトのフィルタリング、グループ化、集計に使用 • DWH(DataWarehouse)におけるディメンショナルモデリングの利点 ◦ クエリパフォーマンスと利便性 • 簡単な例 9 時間 ディメンション 製品名 ディメンション 場所 ディメンション 売上 ファクト 2025/10/17 クリノッペ 東京 10,000円 2025/10/18 ドリランド 神奈川 20,000円
データモデリングの成功の背景 • ベースのデータモデルが既にBEAMを意識したものになっていた ◦ BEAM ▪ Business Event Analytics &
Modeling ◦ 7Wを使うことでステークホルダー全員がディメンショナルに考えられるようにする ▪ Who:誰が ▪ What:何を ▪ When:いつ ▪ Where:どこで ▪ Why:なぜ ▪ How:どのように ▪ HowMany:どれくらい ◦ 必要なレポートを7Wでまとめることで、ビジネスプロセスそのものをデータとしてまとめ ることができる 10
BEAMテーブルの例 11 日付 (When) 会計年度 (When) 四半期 (When) 部名 (Who)
統制科目 (What) 収支科目 (What) 費目 (What) 予算 (HowMany) 実績 (HowMany)
データモデリングについての参考書籍 • アジャイルかどうかを置いておいても、データ分析の データモデリングについて非常に勉強になる • 再現性高く良いモデリングを行うために、知識を体系的 に身につけておくのに良いと思います 12 出典:『アジャイルデータモデリング 組織にデータ分析を広めるためのテー
ブル設計ガイド』 ローレンス・コル / ジム・スタグニット[著], 株式会社風音屋[監訳], 打出紘基/ 佐々木江亜/ 土川稔生 / 濱田大樹 / 妹尾拡樹 / ゆずたそ[翻訳]
集計処理の変遷 13
プロジェクト開始時の想定 14
リリース時: Workflowsでオーケストレーション 15
開発/運用していくにつれて顕在化した課題 16 課題 概要 変更管理が属人的 いつどんな変更を加えたのかSlackや(書いていれば)ド キュメントを追わないと分からない 状態管理が属人的 仕様変更など加えた場合、クエリがどんな状態(変更前 か後か)かの把握が属人的
集計クエリが開発/本番で別れていて冗長 開発用/本番用データセット用にそれぞれ集計クエリが 存在する
現在: DataFormで課題を解決 17
集計処理before/after 18 プロジェクト開始時 現在
AI/ML活用と今後 19
AI活用で誰でもデータを扱えるように • BigQuery in Geminiを使って自然言語でクエリ作成 ◦ 今までクエリ作成力がないとデータを扱えなかった人でもデータを扱えるようになった • DataCanvasを使って複雑なクエリでも少しずつ構築できるように! ◦
視覚的に順を追ってクエリを作成できる ◦ ツリー状に作成したクエリは一時テーブルとして参照可能 ◦ BigQuery in Geminiを使うことで自然言語でクエリの構築が可能 • 自然言語でクエリ作成の例 ◦ 20 -- ID_manage_CDNマスタのプロジェクトIDが1つ以上あるプロジェクトID毎にプロ ジェクトIDの合計数を教えて下さい SELECT project_id, count(project_id) FROM `mst_id_manage_cdn` GROUP BY 1 HAVING count(project_id) > 1;
AI活用で誰でもデータを扱えるように • レポートなどの定型業務はスプレッドシートのGemini in Google Spreadsheetsも活用 ◦ スコープを限定できる ◦ 見出し行を条件を指定すればいいのでデータの抽出方法が推測できる
◦ ピボットテーブルを使って集計もできるので、Geminiが返したデータの検証もスプレッド シート内で完結できる 21
簡単MLで異常値検知 • BigQuery MLで簡単にモデル作成 ◦ SQLのみでモデルの作成と評価ができる ▪ モデルの作成のクエリ ▪ モデルの評価のクエリ
◦ 簡単な異常検知であればものの数分で作成可能 ▪ WorkflowsやCloud Run functionsなどと連携することでSlack通知もできる 22
今後の課題 • AIにメタデータを学習させて、自然言語のオーダに正確にアウトプットを 返せるようにする ◦ Dataplex Universal Catalogを使ってビジネスメタデータを設定して学習 ▪ データの中身はAIが分かるように、方言(社内や部署内でしか通じない表現)などはなるべく避けて
一般的なものにするべき ◦ ビジネス用語集を設定/運用して用語の定義を一元管理するのと同時に、ビジネス理解の属 人化やドキュメント作成地獄からの脱却を目指す ▪ 「ドキュメントは腐る」という名言(迷言?)もちらほら見かけますよね… 23
ご清聴ありがとうございました 24
None