Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データモデリングからはじめるデータマネジメント
Search
たなまい
November 13, 2023
Business
4
3.7k
データモデリングからはじめるデータマネジメント
パーソルキャリア株式会社
#DDDM
#データマネジメント
たなまい
November 13, 2023
Tweet
Share
Other Decks in Business
See All in Business
ゲーム型ダイバーシティ&インクルージョン研修「バーンガ」
chibanba1982
PRO
0
780
技術広報の集い #5 LT 資料 2025 年挑戦したいこと
n0mzk
0
200
システム思考ゲーム「ビールゲーム」
chibanba1982
PRO
0
480
アマチュア技術広報の振り返りと目標
bicstone
2
150
イクシアス株式会社 会社紹介資料
ixyas
0
1.4k
フォロワーシップ、ビジョン共有の重要性を学べる「部課長ゲーム」
chibanba1982
PRO
0
1.2k
ビジネスマナー研修用スライド
chibanba1982
PRO
0
150
Owned株式会社 採用ピッチ
owned_recruit
PRO
0
200
企業向けクイズ管理システム「みんなのクイズ」
chibanba1982
PRO
0
930
コンセンサスゲーム「NASAゲーム カード版」
chibanba1982
PRO
0
2k
ゲーム型ダイバーシティ&インクルージョン研修「バルーンバ人文化を探れ」
chibanba1982
PRO
0
150
ゲーム型メンタルヘルス研修「ウツ会議」
chibanba1982
PRO
0
120
Featured
See All Featured
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
870
RailsConf 2023
tenderlove
29
970
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
26
1.9k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.2k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
45
2.3k
Intergalactic Javascript Robots from Outer Space
tanoku
270
27k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
27
1.5k
Facilitating Awesome Meetings
lara
51
6.2k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Java REST API Framework Comparison - PWX 2021
mraible
28
8.3k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
7k
YesSQL, Process and Tooling at Scale
rocio
170
14k
Transcript
データモデリングからはじめる データマネジメント 2023/11/10 第1回ドメイン駆動データマネジメント「データマネジメントの始め方」 @primeNumber パーソルキャリア株式会社 田中麻衣子
2 本日のテーマ 1 2 3 なぜデータマネジメントをすることになったか 今、どんな体制で、何をやっているのか 今後の課題
3 自己紹介 田中麻衣子 パーソルキャリア株式会社 クライアントP&M本部 デジタルテクノロジー統括部 ずっと“データ分析”してきた人 今年4月からデータマネジメント始めた人 @20neneneneko20
4 本日、話さないこと データマネジメントの詳細(そもそも何ですか?) データマネジメントの必要性(それって意味あるんですか?)
5 会社・サービス 簡単に会社のご紹介
doda会員登録者数 821万人 求人数 24万件以上 登録者数・求人数業界最大級 転職を希望する個人顧客様 採用を希望する法人顧客様へ サービス展開 toC・toBの両手型サービス 展開しているサービスは
20以上 転職支援サービス 中途採用 新卒採用 求人メディアの運営などを通じた人材紹介サービスを展開する会社 →人材紹介サービス:専任のキャリアアドバイザーが転職希望者様と法人顧客様のマッチングを行うサービス ※2023年9月末時点
法人顧客 様への価 値発揮を 総合的に 推進する 人材紹介サービス 専門領域人材紹介 More… 個人顧客 様への価
値発揮を 総合的に 推進する マーケティング インサイド セールス プロダクト 開発 テクノロジー 推進 全ての企業様の採用課題に最もマッチするサービスをスピーディーに提供する クライアント P&M本部 クライアントP&M本部は、今年4月に(再)組成されました
個別事業最適化 More… 調査工数↑ 分散 スピード↓ 我々のミッションに合わせて、データ管理の方法も見直す必要 横断的データ活用 質の担保↓
本発表では、データマネジメントを始める前段階=「なぜデータマネジメントが必 要なのか」という重要なトピックスには触れられませんが、データマネジメント= 「データの価値を維持・向上させて、データでコアドメインの価値を最大限に引き 出す継続的なプログラム活動」としています。 入門 中級 上級
コアドメイン/サブドメイン • コアドメインとは、「中心的事業領域」であり、その部分がなくなると商売がなり立たなくなってしまうような 事業領域を指しています。 • 一方で、サブドメインとはコアドメインをなり立たせるために必要ではあるが、競争優位性や差別化を図るポイ ントにはならない領域を指しています。 • つまり、選択と集中をするために、コア/サブドメインを区別する必要があります。 コアドメイン
(競争優位性を担保する企業のアイデンティティ) サブドメイン ドメイン • 事業課題を技術的なソリューションで解決できる場合、最もシステム 化する価値の高い領域(理想) そのために・・・ • コアドメインがなんであるのか • コアドメインの範囲はどこなのか • システム上ではコアのロジックとサブのロジックを密結合・散在させない ・・・・ようにしななければな、とまず最初に考えました。 【参考】 エリック・エヴァンス 『エリック・エヴァンスのドメイン駆動設計』 ヴォーン・ヴァーノン『実践ドメイン駆動設計』
データマネジメント はじめてみた 体制・方針
データマネジメントに必要な最小単位で、はじめてみました データマネジメント エンジニア ドメインエキスパート 人数: • 1名+サポート2~3名 役割: • 各種調整
• 組織づくり • データ調査 • データモデリング スキルセット: • 分析をしている人 • 基本的なRDBの知識がある人 人数: • 2名+サポート1名 役割: • 基盤構築系全般 • ソリューション選定 スキルセット: • 基盤構築できる人 • データモデリングに詳しい人 人数: • 応じて変動 役割: • 業務について伝授 • 業務上の暗黙知につい て伝授 • 経理・法務などの専門 知識について伝授 スキルセット: • 業務スペシャリスト 分析する人/整える人 仕組みを考える人 直接価値を出す人 現体制/ 役割
“DMBOK”を参考に以下の2つの知識領域(+2)から、はじめてみました ※本日は、時間がないので『DAMA-DMBOK』とその各知識領域の詳細そのものについては割愛しますが、DMBOKとは、データマネ ジメントに関する知識を体系立ててまとめた書籍です。( https://www.dama-japan.org/Introduction.html ) Data Storage & Operations (+2)
(Business)Metadata Data Security Data Modeling & Design “超”概略定義 • データに関する要件の明確化や、実装範囲の決 定を目的に、データモデルを作成すること • データの価値を最大化するために、格納される データを設計し、実装し、サポートすること • メタデータ(データ定義)の管理 • データの信頼性担保と権限管理 データ構造を設計して 安全に 蓄積する
Q.なぜ、 2つの知識領域(+2)から手を出したのか Peter Aiken のフレームワーク https://blogs.sap.com/2020/07/09/why-hr-data- management-strategy-is-important-in-your-hr-transformation/ Data Storage &
Operations (20%) Data Security (20%) Data Modeling & Design (30%) Business MetaData(10%) ビジネス戦略(=データ要件) A.DMBOKでデータマネジメントのphase1として紹介 されていたから
Q.その中でも、データモデリングに注力しているのはなぜか じゃ 全ての企業様の採用課題に最もマッチす るサービスをスピーディーに提供する 採用課題: 各事業営業担当の商談情報集約・可視化 企業属性データ集約 最もマッチする解決策: 企業属性データ、過去の実績データ、採用課 題などから、仮説立案・最適化アルゴリズム
の構築、検証 スピーディー: 正確に、なるべく早く ソリューションで 解決可能な領域 A.「データモデリング」がミッションと現状のギャップを埋めるためにマストだとおもったから 顧客に提供する価値 業務プロセス 業務プロセスを データに写像する 写像したデータを システムに蓄積 データ分析 インテリジェンス 共通言語
データモデル データモデルがない世界 業務① 業務② 業務③ 売上 派生 業務 派生 業務
派生 業務 業務の世界(概念) システムの世界(物理) データ活用上生じる課題 業務④ 【調査工数がかかる】 ✓ 「業務②が売上に与える影響を調べて」と言われ たが、業務②のデータはどこにあるんだ? 【集計ミス】 ✓ 売上計算のテーブル間違えてたみたい・・・ 【エンジニアがいないと分析できない】 ✓ すぐ集計したいのに、SQLを解読しないとテーブル の関係性がわからない! 【非データ人材の業務知識が活用されない】 ✓ 業務課題解決に一番近い「ドメインエキスパー ト」がデータで仮説立案・仮説検証ができない 【データ人材が直ぐに本領発揮でない】 ✓ せっかくjoinしたデータサイエンティストが、業務理 解ではなく、SQLの読解に時間を費やす システムの言葉で記述 一意でない ビジネススピード
データモデル データモデルがある世界 業務① 業務② 業務③ 売上 派生 業務 派生 業務
派生 業務 業務の世界(概念) システムの世界(物理) 業務④ 業務① 業務② 集計値 業務の関係性でリレーションをはる ≒ 業務の世界を物理にマッピング ① 企業・組織にどのようなデータがあるか把握するため ② 全体を俯瞰したデータ配置とデータの流れを見える ようにするため ③ データ基盤内のデータ構造を見えるようにするため ④ データのあるべき姿を設計し、今後データに関して 取り組むべきことを決めるため(不足や冗長) ⑤ データ要件をシステム開発者に正しく伝えるため (ビジネスとエンジニアの共通言語) ⑥ システム保守を効率よく行うため データモデリングの目的 売上予測がしたい!
データモデル Q.その中でも、データモデリングに注力しているのはなぜか じゃ 別回答.チーム(データマネジメント、エンジニア、ビジネス)で目的・目線をそろえたかったから データマネジメント=データの価値を維持・向上させて、デー タでコアドメインの価値を最大限に引き出すプログラム活動 コアドメイン=「中心的事業領域」であり、その部分がな くなると商売がなり立たなくなってしまうような事業領域 我々データまわりの人間は、フロントから遠いので、 「課題感」に実感がない。重要なのはドメインを駆動して
いくこと、でありそのためのデータマネジメントである、 という目線
本日のまとめと課題 最後に
20 1 2 3 4月からデータマネジメント組織を立ち上げてみました 右も左もわからず、DAMAピラミッドのフェーズ1から始めてみました データ活用推進のためには、業務プロセスをデータに写像する 必要があるなと思い、データモデリングに注力しました 4 理想には、まだまだ遠いです
まとめ
21 1 2 3 組織づくり:業務・システム変化を報連相する横断的組織作り 維持体制:ドキュメント(モデル)が腐らないような維持体制 データ活用の文化醸成:結局使ってもらえなければ意味がない 4 仲間が足りない!!(絶賛仲間を募集中) 課題
22 課題+: • データモデリングは銀の弾丸ではない • ただし、データ活用を推進する上での課題解決にはつながりそう • 得られるメリットに比例して、労力がかかるので長期的かつ継続的な 活動と捉えるのがよさそう
23 Appendix How to Prepare Data Modeling
そもそも、データモデリングとは何か、すごく簡単に説明します • データモデリングとは、データに関する要件の明確化や、実装範囲の決定を目的に、 データモデルを作成すること • ここでいうデータモデルとは、あらかじめ定めた様式に従ってデータの名称や定義、デー タ同士の関係性などを記述したもの 定義 想定成果物 •
概念データモデル:企業の現実をそのまま写し取ったモデル • 論理データモデル:概念データモデルにデータ要件(主要属性や関係性)を追加 したモデル • 物理データモデル:論理データモデルをベースにシステム実装を想定した詳細モデル • データ定義書とその作成プロセス ※データ定義:ドメイン定義、エンティティ定義、データ項目定義、コード定義、 コード値定義の総称 (business) Metadata
そもそも、データモデリングとは何か、すごく簡単に説明します 参照:概念・論理・物理データモデルの違いは人によって異なる?データ総研の考え方をご紹介 https://jp.drinet.co.jp/blog/modeling_dri 概念 論理 物理 目安:経営者がみてわかる 目安:業務担当者がみてわかる 目安:システム担当者がみてわかる
まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー 面接 契約 求人要件 ヒアリング 求職者様の ご紹介
問い合わせ 決定 請求 BPMNがない場合は、ビジネスサイドと「一緒に作りましょう」が第一歩? No 業務リスト 1 問い合わせ対応 2 契約 3 求人要件のヒアリング 4 求職者様のご紹介 5 進捗確認 6 請求 1 BPMN図から業務リスを作成
まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー 企業様 営業 アドバイザー No 業務リスト 業務リストの詳細化
業務上利用しているシステム 1 問い合わせ対応 メール 2 契約 2-1顧客IDの発行 基幹システムAの••画面 (例えば顧客管理画面など) 2-2顧客情報の登録 基幹システムA××画面 3 求人要件のヒアリング 営業ツール 4 求職者様のご紹介 基幹システムB 5 進捗確認 営業ツール 6 請求 決済システム 2 業務リストをもとにビジネスサイドにヒアリング。リストの詳細化とデータ生成元システムの確認
まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー 営業 アドバイザー No 業務リスト 業務リストの詳 細化
業務上利用してい るシステム 2 契約 2-1顧客IDの発 行 基幹システムAの ••画面 2-2顧客情報の 登録 基幹システムAの ××画面 3 業務上利用しているシステムの、I/Oをヒアリング 実際に画面を見せてもらいます ここでの入力項目=「業務データの生成元」 メイン業務で利用している画面の入力項目をリスト化していきます 基幹システムAの••画面
まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー No 業務リス ト 業務リストの 詳細化 業務上利用して
いるシステム 入力項目一覧 テーブル名 物理カラム名 2 契約 2-1顧客IDの 発行 基幹システムA の••画面 法人••ID Table_001 YYYY 契約年月 Table_100 XXXX 契約タイプ a_table_09 AAAA 契約者情報 b_table_08 ZZZZ 更新年月 c_table_010 DDDD 4 主要画面の入力項目をリスト化し、既存DB上のデータテーブルとカラムと照合していきます
まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー No 業務リス ト 業務リストの 詳細化 業務上利用して
いるシステム 入力項目一覧 物理カラム名 データ項目定義 2 契約 2-1顧客IDの 発行 基幹システムA の••画面 法人••ID YYYY 新規契約した顧客に システムから発番さ れる7桁のコードです。 重複はありません。 契約年月 XXXX 契約タイプ AAAA 契約者情報 ZZZZ 更新年月 DDDD 5 以下のリストに、データ定義(ドメイン定義、エンティティ定義、データ項目定義、コード定義、 コード値定義)を追記していきます(ここまではまだ、できていません‥‥)
まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー 6 業務リストに対応して、これら調査を実施していきます。 正直めちゃくちゃ大変ですが、メイン業務を押さえると山を越えた!という感じになっていきます No 業務リスト 業務詳細化
業務シ ステム 入力項目 テーブル名 カラム名 データ定義 1 問い合わせ対 応 2 契約 3 求人要件のヒ アリング 4 求職者様のご 紹介 5 進捗確認 6 請求 これらを抽出したら、いざデータモデリングへ! 概念データモデルから物理データモデリングまで一気通貫で進めます (データ定義はめちゃくちゃ大変なので、データモデリングが終わっ たら、対応していきます)
まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー 7 メタデータの収集・管理&データ統合のために、troccoのPoCをはじめました!