Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「データモデリング実践入門」は20年経っても色あせない
Search
wakama1994
February 28, 2024
Technology
2
730
「データモデリング実践入門」は20年経っても色あせない
めぐろLT#12「おすすめ書籍紹介LT」の登壇資料
https://meguro-lt.connpass.com/event/305704/
wakama1994
February 28, 2024
Tweet
Share
More Decks by wakama1994
See All by wakama1994
Kaggleの歩き方-関西Kaggler会に参加してみて-
wakamatsu_takumu
2
360
BQで天気基盤をつくって、役立つ情報を可視化してみた!
wakamatsu_takumu
4
940
いろんな可視化ツールあるけどggplotて何がいいの?- 複数ツールで比較してみた!-
wakamatsu_takumu
1
1.2k
文系出身でも「アルゴリズム×数学」はスッキリ理解できた!話
wakamatsu_takumu
0
390
ChatGPTにどんなときRを使えばいいか聞いてみた!
wakamatsu_takumu
0
630
A/Bテスト実践ガイド ~真のデータドリブンへ至る信用できる実験とは~
wakamatsu_takumu
1
920
EBImageを用いたVR画像の変化域抽出と生態系への活用.pdf
wakamatsu_takumu
0
310
データサイエンス100本ノック(構造化データ加工編) No1~40までをSQLで書いてみて
wakamatsu_takumu
0
97
Other Decks in Technology
See All in Technology
誰も全体を知らない ~ ロールの垣根を超えて引き上げる開発生産性 / Boosting Development Productivity Across Roles
kakehashi
1
230
生成AIが変えるデータ分析の全体像
ishikawa_satoru
0
150
テストコード品質を高めるためにMutation Testingライブラリ・Strykerを実戦導入してみた話
ysknsid25
7
2.6k
Engineer Career Talk
lycorp_recruit_jp
0
180
Adopting Jetpack Compose in Your Existing Project - GDG DevFest Bangkok 2024
akexorcist
0
110
20241120_JAWS_東京_ランチタイムLT#17_AWS認定全冠の先へ
tsumita
2
280
初心者向けAWS Securityの勉強会mini Security-JAWSを9ヶ月ぐらい実施してきての近況
cmusudakeisuke
0
130
OTelCol_TailSampling_and_SpanMetrics
gumamon
1
170
いざ、BSC討伐の旅
nikinusu
2
780
OCI Vault 概要
oracle4engineer
PRO
0
9.7k
Flutterによる 効率的なAndroid・iOS・Webアプリケーション開発の事例
recruitengineers
PRO
0
110
社内で最大の技術的負債のリファクタリングに取り組んだお話し
kidooonn
1
550
Featured
See All Featured
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
329
21k
Gamification - CAS2011
davidbonilla
80
5k
Building Flexible Design Systems
yeseniaperezcruz
327
38k
What's new in Ruby 2.0
geeforr
343
31k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.1k
How STYLIGHT went responsive
nonsquared
95
5.2k
For a Future-Friendly Web
brad_frost
175
9.4k
The Power of CSS Pseudo Elements
geoffreycrofte
73
5.3k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.3k
Why Our Code Smells
bkeepers
PRO
334
57k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.1k
Designing for humans not robots
tammielis
250
25k
Transcript
「実践的データモデリング入門」は 20年経っても色あせない @wakama1994 2024.02.28 めぐろLT #12
AGENDA 自己紹介 書籍の紹介 書籍のここがすごい! 最新の技術を使うとより凄い! さいごに 01. 02. 03. 04.
05.
©primeNumber Inc. 3 若松 拓夢 WHO AM I? primeNumber.Inc ソリューション本部 データアナリスト
北海道出身 1994年6月生まれ 国立大学の法学部で計量経済学に出会い 理工系の大学院で修士号を取る 新卒は気象会社で分析とサービス開発 更なるスキルアップを考え primeNumberに転職 趣味は自転車・秘境駅めぐり・Kaggle ・勉強会(懇親会) etc 1 3 @wakama1994 Takumu Wakamatsu
©primeNumber Inc. 書籍の紹介 Introduction of Book 4
©primeNumber Inc. 5 書籍の概要 • 2003年3月出版 • データの構造〜DB設計まで抑えた書籍 • 実践編が充実しており、実務に役立つ
◦ 20年前のビジネスモデルだが十分使える • 1回の通読程度では不十分 ◦ 初学者向きではない ◦ 何度も読み返す必要あり 実践的データモデリング入門 翔泳社 真野正 著
©primeNumber Inc. 6 • データの概観-ER図- 実際のDB設計までを指す ◦ 概念モデル ◦ 論理モデル
◦ 物理モデル • ER図だけを指すものではない データモデリングとは? 図1-4 システム工程とデータモデリング 著作権の都合上 speaker deck非公開
©primeNumber Inc. 書籍のここがすごい! Attractive point of this Book 7
©primeNumber Inc. 8 ① データの把握~DB構築まで一気通貫で! 図0-3モデリング手法と章立て 図0-2 モデリング手法と章立て 著作権の都合上 speaker
deck非公開 著作権の都合上 speaker deck非公開
©primeNumber Inc. 9 • 章末のポイントページで学ぶべきことが整理! ② 各章のポイントページがすごい! ❏ データモデルはエンティティ、属性 (アトリビュート)、リレーション
シップの3要素で構成される ❏ エンティティには独立エンティティと 従属エンティティがある ❏ リレーションシップには実線で表す依 存関係と破線で表す非依存関係がある ❏ 属性は、エンティティ内のインスタン スを一意に識別する主キーと主キー以 外から構成される ❏ リレーションシップはビジネスを如実 に表す …. 第2章 : モデルの基本作法より 第6章: ネーミング標準とドメイン ❏ システム間での同音異義語、異音同義 語の発生を避けるためにはあ、ネーミ ング標準が必要である ❏ データの項目名はエンティティから離 れても一意に識別できるのが理想であ る。 ❏ データ定義とは、データ項目を因数分 解し、新名称を付加することである。 ❏ データ項目の構成要素は、名称、意味 定義、ドメイン、データタイプ、長さ などから構成される …. ※書籍から一部を抜粋
©primeNumber Inc. 10 • 具体的なビジネスモデルに基づく設計も掲載! ③ 実践編の充実度がすごい! エンティティ 名 エンティティ定
義 SEQ 属性名 属性定義 論理デー タタイプ 桁数 PK ドメイン名 クレジット会 員 ネット書店での 購入代金の支 払いをクレジッ トカードで行お うとした顧客の クレジットカード 情報 1 種別 クレジットカード 会社 CHAR 2 Yes クレジットカー ド種別 2 番号 XXXX-XXXX- XXXX-XXX (ハイフンなし) CHAR 12 Yes クレジットカー ド番号 3 名義人 カード名義人 VARCHAR 40 No 氏名 4 有効期限 有効期限 Yyyy/mm-期限 (年月) DATE No 期限 (年月) 5 会社コード クレジットカードの 会社コード CHAR 10 No 法人コード 第9章 トップダウンモデルとボトムアップモデルの融合 表9-4 エンティティ定義表 ※書籍から一部を抜粋 30種類のエンティティ名
©primeNumber Inc. 最新の技術を使うともっと凄い! Adding to New technology with this book
11
©primeNumber Inc. 12 • 昨今のクラウドサービスの普及によ り、容量に神経を使う必要がなくなっ ている ◦ 例えば、AWSのクラウドデータ ベースでは、従量課金制で用途に
合わせた利用が可能 ◦ GCPでも同様のサービスがあった AWSなどのクラウドサービスも併用できる! ①各テーブルのレコード長を算出する ②レコード長をもとに最適なサイズを決める ③レコードあるいはレコード単位の付加情報 の長さを考慮して、1ブロックあたりの格納 レコード数を算出する ④最大格納データ件数を算出する ⑤必要サイズ数を算出する(初期値、増分) ⑥追加/更新の頻度を考慮してブロックあたり のフリースペースサイズを決める 第15章 物理実装のポイント 容量の見積もり手順より ※書籍から一部を抜粋
©primeNumber Inc. 13 • 第12章「モデリングツールの利用法」 ではErwinやER/studioといったUIでモ デリングできるツールの紹介 ◦ 「依存関係を双方向で引けない」 等の修正可能だが、紐付けが冗長
や複雑な場合は修正不可 • Geminiの登場で精緻なチェックまで 実施可能性あり! LLMの応答での可能性も! ER/studio Geminiの応答例
©primeNumber Inc. さいごに Conclusion 14
©primeNumber Inc. 15 • 実践的データモデリング入門は20年経っても色あせない! ◦ 実践編の充実が実務に役立つ ◦ 章末のポイントページで初学者でも安心 ◦
最新の技術と組み合わせてさらに充実 • 繰り返し読むことで理解を深めよう! ◦ DB初学者は書籍で出てくる単語も難解 ◦ 1冊でDB構築まで至れるため、本業に活かせそう まとめ
©primeNumber Inc. 16 現所属チームの業務 16 コンサルティングからデータ基盤構築・運用、活用領域(BI/機械学習)の構築まで、 データエンジニアリングカンパニーとして、データ基盤の構築からデータ活用を一気通貫でサポートしています。 データ分析・機械学習 BI導入
統合・蓄積・ビジネスロジック実装 前処理構築 データ整備 後処理構築 データ可視化 DWH構築 転送・加工マネジメント データレイク構築 データバリデーション 業務の見える化 コンサルテーション • ダッシュボード構築 • メンテナンス etc. • データの学習 • データ蓄積方針 • データの品質 • 業務の棚卸し • 業務整理 BigQuery Snowflake Redshift Tableau Looker Studio Looker • バッチデータ転送 • 転送方法・頻度 • マート作成粒度 • ガバナンス etc. 機械学習基盤選定 パイプライン構築 学 習 推 論 SaaS/ DB / その他サービス • 各種コネクタの追加 trocco®による シームレスなデータ連携 • リアルタイム処理 pN-Ops pN-Integration 弊社ソリューションのサービス提供範囲
あらゆるデータを、 ビジネスの力に変える。 primeNumberは、データテクノロジーカンパニー。 あらゆるデータが爆発的に増えていく時代に、 誰もがすばやく、簡単にデータを使える環境を構築し、 データ活用までのプロセスを最適化。 高度なテクノロジーと独自のアイデアで、 世界中のビジネスを支援します。 V I
S I O N