Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「データモデリング実践入門」は20年経っても色あせない
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
wakama1994
February 28, 2024
Technology
4
1.3k
「データモデリング実践入門」は20年経っても色あせない
めぐろLT#12「おすすめ書籍紹介LT」の登壇資料
https://meguro-lt.connpass.com/event/305704/
wakama1994
February 28, 2024
Tweet
Share
More Decks by wakama1994
See All by wakama1994
ド文系だった私が、 KaggleのNCAAコンペでソロ金取れるまで
wakamatsu_takumu
2
1.9k
「実践DataOps」書籍紹介
wakamatsu_takumu
0
39
Kaggleの歩き方-関西Kaggler会に参加してみて-
wakamatsu_takumu
2
620
BQで天気基盤をつくって、役立つ情報を可視化してみた!
wakamatsu_takumu
4
1.2k
いろんな可視化ツールあるけどggplotて何がいいの?- 複数ツールで比較してみた!-
wakamatsu_takumu
1
1.6k
文系出身でも「アルゴリズム×数学」はスッキリ理解できた!話
wakamatsu_takumu
0
610
ChatGPTにどんなときRを使えばいいか聞いてみた!
wakamatsu_takumu
0
720
A/Bテスト実践ガイド ~真のデータドリブンへ至る信用できる実験とは~
wakamatsu_takumu
1
1.7k
EBImageを用いたVR画像の変化域抽出と生態系への活用.pdf
wakamatsu_takumu
0
410
Other Decks in Technology
See All in Technology
外部キー制約の知っておいて欲しいこと - RDBMSを正しく使うために必要なこと / FOREIGN KEY Night
soudai
PRO
12
5.5k
Azure Durable Functions で作った NL2SQL Agent の精度向上に取り組んだ話/jat08
thara0402
0
190
プロダクト成長を支える開発基盤とスケールに伴う課題
yuu26
4
1.3k
変化するコーディングエージェントとの現実的な付き合い方 〜Cursor安定択説と、ツールに依存しない「資産」〜
empitsu
4
1.4k
GitHub Issue Templates + Coding Agentで簡単みんなでIaC/Easy IaC for Everyone with GitHub Issue Templates + Coding Agent
aeonpeople
1
240
AI駆動PjMの理想像 と現在地 -実践例を添えて-
masahiro_okamura
1
120
Tebiki Engineering Team Deck
tebiki
0
24k
学生・新卒・ジュニアから目指すSRE
hiroyaonoe
2
620
配列に見る bash と zsh の違い
kazzpapa3
3
160
CDK対応したAWS DevOps Agentを試そう_20260201
masakiokuda
1
320
Claude_CodeでSEOを最適化する_AI_Ops_Community_Vol.2__マーケティングx_AIはここまで進化した.pdf
riku_423
2
570
AzureでのIaC - Bicep? Terraform? それ早く言ってよ会議
torumakabe
1
560
Featured
See All Featured
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
940
How to build a perfect <img>
jonoalderson
1
4.9k
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
910
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
110
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
0
3.4k
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
1.9k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
62
50k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
9.5k
The SEO Collaboration Effect
kristinabergwall1
0
350
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
110
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.7k
Transcript
「実践的データモデリング入門」は 20年経っても色あせない @wakama1994 2024.02.28 めぐろLT #12
AGENDA 自己紹介 書籍の紹介 書籍のここがすごい! 最新の技術を使うとより凄い! さいごに 01. 02. 03. 04.
05.
©primeNumber Inc. 3 若松 拓夢 WHO AM I? primeNumber.Inc ソリューション本部 データアナリスト
北海道出身 1994年6月生まれ 国立大学の法学部で計量経済学に出会い 理工系の大学院で修士号を取る 新卒は気象会社で分析とサービス開発 更なるスキルアップを考え primeNumberに転職 趣味は自転車・秘境駅めぐり・Kaggle ・勉強会(懇親会) etc 1 3 @wakama1994 Takumu Wakamatsu
©primeNumber Inc. 書籍の紹介 Introduction of Book 4
©primeNumber Inc. 5 書籍の概要 • 2003年3月出版 • データの構造〜DB設計まで抑えた書籍 • 実践編が充実しており、実務に役立つ
◦ 20年前のビジネスモデルだが十分使える • 1回の通読程度では不十分 ◦ 初学者向きではない ◦ 何度も読み返す必要あり 実践的データモデリング入門 翔泳社 真野正 著
©primeNumber Inc. 6 • データの概観-ER図- 実際のDB設計までを指す ◦ 概念モデル ◦ 論理モデル
◦ 物理モデル • ER図だけを指すものではない データモデリングとは? 図1-4 システム工程とデータモデリング 著作権の都合上 speaker deck非公開
©primeNumber Inc. 書籍のここがすごい! Attractive point of this Book 7
©primeNumber Inc. 8 ① データの把握~DB構築まで一気通貫で! 図0-3モデリング手法と章立て 図0-2 モデリング手法と章立て 著作権の都合上 speaker
deck非公開 著作権の都合上 speaker deck非公開
©primeNumber Inc. 9 • 章末のポイントページで学ぶべきことが整理! ② 各章のポイントページがすごい! ❏ データモデルはエンティティ、属性 (アトリビュート)、リレーション
シップの3要素で構成される ❏ エンティティには独立エンティティと 従属エンティティがある ❏ リレーションシップには実線で表す依 存関係と破線で表す非依存関係がある ❏ 属性は、エンティティ内のインスタン スを一意に識別する主キーと主キー以 外から構成される ❏ リレーションシップはビジネスを如実 に表す …. 第2章 : モデルの基本作法より 第6章: ネーミング標準とドメイン ❏ システム間での同音異義語、異音同義 語の発生を避けるためにはあ、ネーミ ング標準が必要である ❏ データの項目名はエンティティから離 れても一意に識別できるのが理想であ る。 ❏ データ定義とは、データ項目を因数分 解し、新名称を付加することである。 ❏ データ項目の構成要素は、名称、意味 定義、ドメイン、データタイプ、長さ などから構成される …. ※書籍から一部を抜粋
©primeNumber Inc. 10 • 具体的なビジネスモデルに基づく設計も掲載! ③ 実践編の充実度がすごい! エンティティ 名 エンティティ定
義 SEQ 属性名 属性定義 論理デー タタイプ 桁数 PK ドメイン名 クレジット会 員 ネット書店での 購入代金の支 払いをクレジッ トカードで行お うとした顧客の クレジットカード 情報 1 種別 クレジットカード 会社 CHAR 2 Yes クレジットカー ド種別 2 番号 XXXX-XXXX- XXXX-XXX (ハイフンなし) CHAR 12 Yes クレジットカー ド番号 3 名義人 カード名義人 VARCHAR 40 No 氏名 4 有効期限 有効期限 Yyyy/mm-期限 (年月) DATE No 期限 (年月) 5 会社コード クレジットカードの 会社コード CHAR 10 No 法人コード 第9章 トップダウンモデルとボトムアップモデルの融合 表9-4 エンティティ定義表 ※書籍から一部を抜粋 30種類のエンティティ名
©primeNumber Inc. 最新の技術を使うともっと凄い! Adding to New technology with this book
11
©primeNumber Inc. 12 • 昨今のクラウドサービスの普及によ り、容量に神経を使う必要がなくなっ ている ◦ 例えば、AWSのクラウドデータ ベースでは、従量課金制で用途に
合わせた利用が可能 ◦ GCPでも同様のサービスがあった AWSなどのクラウドサービスも併用できる! ①各テーブルのレコード長を算出する ②レコード長をもとに最適なサイズを決める ③レコードあるいはレコード単位の付加情報 の長さを考慮して、1ブロックあたりの格納 レコード数を算出する ④最大格納データ件数を算出する ⑤必要サイズ数を算出する(初期値、増分) ⑥追加/更新の頻度を考慮してブロックあたり のフリースペースサイズを決める 第15章 物理実装のポイント 容量の見積もり手順より ※書籍から一部を抜粋
©primeNumber Inc. 13 • 第12章「モデリングツールの利用法」 ではErwinやER/studioといったUIでモ デリングできるツールの紹介 ◦ 「依存関係を双方向で引けない」 等の修正可能だが、紐付けが冗長
や複雑な場合は修正不可 • Geminiの登場で精緻なチェックまで 実施可能性あり! LLMの応答での可能性も! ER/studio Geminiの応答例
©primeNumber Inc. さいごに Conclusion 14
©primeNumber Inc. 15 • 実践的データモデリング入門は20年経っても色あせない! ◦ 実践編の充実が実務に役立つ ◦ 章末のポイントページで初学者でも安心 ◦
最新の技術と組み合わせてさらに充実 • 繰り返し読むことで理解を深めよう! ◦ DB初学者は書籍で出てくる単語も難解 ◦ 1冊でDB構築まで至れるため、本業に活かせそう まとめ
©primeNumber Inc. 16 現所属チームの業務 16 コンサルティングからデータ基盤構築・運用、活用領域(BI/機械学習)の構築まで、 データエンジニアリングカンパニーとして、データ基盤の構築からデータ活用を一気通貫でサポートしています。 データ分析・機械学習 BI導入
統合・蓄積・ビジネスロジック実装 前処理構築 データ整備 後処理構築 データ可視化 DWH構築 転送・加工マネジメント データレイク構築 データバリデーション 業務の見える化 コンサルテーション • ダッシュボード構築 • メンテナンス etc. • データの学習 • データ蓄積方針 • データの品質 • 業務の棚卸し • 業務整理 BigQuery Snowflake Redshift Tableau Looker Studio Looker • バッチデータ転送 • 転送方法・頻度 • マート作成粒度 • ガバナンス etc. 機械学習基盤選定 パイプライン構築 学 習 推 論 SaaS/ DB / その他サービス • 各種コネクタの追加 trocco®による シームレスなデータ連携 • リアルタイム処理 pN-Ops pN-Integration 弊社ソリューションのサービス提供範囲
あらゆるデータを、 ビジネスの力に変える。 primeNumberは、データテクノロジーカンパニー。 あらゆるデータが爆発的に増えていく時代に、 誰もがすばやく、簡単にデータを使える環境を構築し、 データ活用までのプロセスを最適化。 高度なテクノロジーと独自のアイデアで、 世界中のビジネスを支援します。 V I
S I O N