Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データモデリングからはじめるデータマネジメント

たなまい
November 13, 2023

 データモデリングからはじめるデータマネジメント

パーソルキャリア株式会社
#DDDM
#データマネジメント

たなまい

November 13, 2023
Tweet

Other Decks in Business

Transcript

  1. データモデリングからはじめる
    データマネジメント
    2023/11/10
    第1回ドメイン駆動データマネジメント「データマネジメントの始め方」
    @primeNumber
    パーソルキャリア株式会社 田中麻衣子

    View full-size slide

  2. 2
    本日のテーマ
    1
    2
    3
    なぜデータマネジメントをすることになったか
    今、どんな体制で、何をやっているのか
    今後の課題

    View full-size slide

  3. 3
    自己紹介
    田中麻衣子
    パーソルキャリア株式会社
    クライアントP&M本部
    デジタルテクノロジー統括部
    ずっと“データ分析”してきた人
    今年4月からデータマネジメント始めた人
    @20neneneneko20

    View full-size slide

  4. 4
    本日、話さないこと データマネジメントの詳細(そもそも何ですか?)
    データマネジメントの必要性(それって意味あるんですか?)

    View full-size slide

  5. 5
    会社・サービス 簡単に会社のご紹介

    View full-size slide

  6. doda会員登録者数
    821万人
    求人数
    24万件以上
    登録者数・求人数業界最大級
    転職を希望する個人顧客様
    採用を希望する法人顧客様へ
    サービス展開
    toC・toBの両手型サービス
    展開しているサービスは
    20以上
    転職支援サービス
    中途採用 新卒採用
    求人メディアの運営などを通じた人材紹介サービスを展開する会社
    →人材紹介サービス:専任のキャリアアドバイザーが転職希望者様と法人顧客様のマッチングを行うサービス
    ※2023年9月末時点

    View full-size slide

  7. 法人顧客
    様への価
    値発揮を
    総合的に
    推進する
    人材紹介サービス
    専門領域人材紹介
    More…
    個人顧客
    様への価
    値発揮を
    総合的に
    推進する
    マーケティング
    インサイド
    セールス
    プロダクト
    開発
    テクノロジー
    推進
    全ての企業様の採用課題に最もマッチするサービスをスピーディーに提供する
    クライアント
    P&M本部
    クライアントP&M本部は、今年4月に(再)組成されました

    View full-size slide

  8. 個別事業最適化
    More…
    調査工数↑
    分散
    スピード↓
    我々のミッションに合わせて、データ管理の方法も見直す必要
    横断的データ活用
    質の担保↓

    View full-size slide

  9. 本発表では、データマネジメントを始める前段階=「なぜデータマネジメントが必
    要なのか」という重要なトピックスには触れられませんが、データマネジメント=
    「データの価値を維持・向上させて、データでコアドメインの価値を最大限に引き
    出す継続的なプログラム活動」としています。
    入門 中級 上級

    View full-size slide

  10. コアドメイン/サブドメイン
    • コアドメインとは、「中心的事業領域」であり、その部分がなくなると商売がなり立たなくなってしまうような
    事業領域を指しています。
    • 一方で、サブドメインとはコアドメインをなり立たせるために必要ではあるが、競争優位性や差別化を図るポイ
    ントにはならない領域を指しています。
    • つまり、選択と集中をするために、コア/サブドメインを区別する必要があります。
    コアドメイン
    (競争優位性を担保する企業のアイデンティティ)
    サブドメイン
    ドメイン
    • 事業課題を技術的なソリューションで解決できる場合、最もシステム
    化する価値の高い領域(理想)
    そのために・・・
    • コアドメインがなんであるのか
    • コアドメインの範囲はどこなのか
    • システム上ではコアのロジックとサブのロジックを密結合・散在させない
    ・・・・ようにしななければな、とまず最初に考えました。
    【参考】
    エリック・エヴァンス 『エリック・エヴァンスのドメイン駆動設計』
    ヴォーン・ヴァーノン『実践ドメイン駆動設計』

    View full-size slide

  11. データマネジメント
    はじめてみた
    体制・方針

    View full-size slide

  12. データマネジメントに必要な最小単位で、はじめてみました
    データマネジメント
    エンジニア ドメインエキスパート
    人数:
    • 1名+サポート2~3名
    役割:
    • 各種調整
    • 組織づくり
    • データ調査
    • データモデリング
    スキルセット:
    • 分析をしている人
    • 基本的なRDBの知識がある人
    人数:
    • 2名+サポート1名
    役割:
    • 基盤構築系全般
    • ソリューション選定
    スキルセット:
    • 基盤構築できる人
    • データモデリングに詳しい人
    人数:
    • 応じて変動
    役割:
    • 業務について伝授
    • 業務上の暗黙知につい
    て伝授
    • 経理・法務などの専門
    知識について伝授
    スキルセット:
    • 業務スペシャリスト
    分析する人/整える人
    仕組みを考える人 直接価値を出す人
    現体制/
    役割

    View full-size slide

  13. “DMBOK”を参考に以下の2つの知識領域(+2)から、はじめてみました
    ※本日は、時間がないので『DAMA-DMBOK』とその各知識領域の詳細そのものについては割愛しますが、DMBOKとは、データマネ
    ジメントに関する知識を体系立ててまとめた書籍です。( https://www.dama-japan.org/Introduction.html )
    Data Storage &
    Operations
    (+2)
    (Business)Metadata
    Data Security
    Data Modeling & Design
    “超”概略定義
    • データに関する要件の明確化や、実装範囲の決
    定を目的に、データモデルを作成すること
    • データの価値を最大化するために、格納される
    データを設計し、実装し、サポートすること
    • メタデータ(データ定義)の管理
    • データの信頼性担保と権限管理
    データ構造を設計して 安全に 蓄積する

    View full-size slide

  14. Q.なぜ、 2つの知識領域(+2)から手を出したのか
    Peter Aiken のフレームワーク https://blogs.sap.com/2020/07/09/why-hr-data-
    management-strategy-is-important-in-your-hr-transformation/
    Data Storage &
    Operations
    (20%)
    Data Security
    (20%)
    Data Modeling & Design
    (30%)
    Business MetaData(10%)
    ビジネス戦略(=データ要件)
    A.DMBOKでデータマネジメントのphase1として紹介
    されていたから

    View full-size slide

  15. Q.その中でも、データモデリングに注力しているのはなぜか
    じゃ
    全ての企業様の採用課題に最もマッチす
    るサービスをスピーディーに提供する
    採用課題:
    各事業営業担当の商談情報集約・可視化
    企業属性データ集約
    最もマッチする解決策:
    企業属性データ、過去の実績データ、採用課
    題などから、仮説立案・最適化アルゴリズム
    の構築、検証
    スピーディー:
    正確に、なるべく早く
    ソリューションで
    解決可能な領域
    A.「データモデリング」がミッションと現状のギャップを埋めるためにマストだとおもったから
    顧客に提供する価値
    業務プロセス
    業務プロセスを
    データに写像する
    写像したデータを
    システムに蓄積
    データ分析
    インテリジェンス
    共通言語

    View full-size slide

  16. データモデル データモデルがない世界
    業務① 業務② 業務③
    売上
    派生
    業務
    派生
    業務
    派生
    業務
    業務の世界(概念)
    システムの世界(物理) データ活用上生じる課題
    業務④
    【調査工数がかかる】
    ✓ 「業務②が売上に与える影響を調べて」と言われ
    たが、業務②のデータはどこにあるんだ?
    【集計ミス】
    ✓ 売上計算のテーブル間違えてたみたい・・・
    【エンジニアがいないと分析できない】
    ✓ すぐ集計したいのに、SQLを解読しないとテーブル
    の関係性がわからない!
    【非データ人材の業務知識が活用されない】
    ✓ 業務課題解決に一番近い「ドメインエキスパー
    ト」がデータで仮説立案・仮説検証ができない
    【データ人材が直ぐに本領発揮でない】
    ✓ せっかくjoinしたデータサイエンティストが、業務理
    解ではなく、SQLの読解に時間を費やす
    システムの言葉で記述
    一意でない
    ビジネススピード

    View full-size slide

  17. データモデル データモデルがある世界
    業務① 業務② 業務③
    売上
    派生
    業務
    派生
    業務
    派生
    業務
    業務の世界(概念)
    システムの世界(物理)
    業務④
    業務① 業務② 集計値
    業務の関係性でリレーションをはる

    業務の世界を物理にマッピング
    ① 企業・組織にどのようなデータがあるか把握するため
    ② 全体を俯瞰したデータ配置とデータの流れを見える
    ようにするため
    ③ データ基盤内のデータ構造を見えるようにするため
    ④ データのあるべき姿を設計し、今後データに関して
    取り組むべきことを決めるため(不足や冗長)
    ⑤ データ要件をシステム開発者に正しく伝えるため
    (ビジネスとエンジニアの共通言語)
    ⑥ システム保守を効率よく行うため
    データモデリングの目的
    売上予測がしたい!

    View full-size slide

  18. データモデル
    Q.その中でも、データモデリングに注力しているのはなぜか
    じゃ
    別回答.チーム(データマネジメント、エンジニア、ビジネス)で目的・目線をそろえたかったから
    データマネジメント=データの価値を維持・向上させて、デー
    タでコアドメインの価値を最大限に引き出すプログラム活動
    コアドメイン=「中心的事業領域」であり、その部分がな
    くなると商売がなり立たなくなってしまうような事業領域
    我々データまわりの人間は、フロントから遠いので、
    「課題感」に実感がない。重要なのはドメインを駆動して
    いくこと、でありそのためのデータマネジメントである、
    という目線

    View full-size slide

  19. 本日のまとめと課題
    最後に

    View full-size slide

  20. 20
    1
    2
    3
    4月からデータマネジメント組織を立ち上げてみました
    右も左もわからず、DAMAピラミッドのフェーズ1から始めてみました
    データ活用推進のためには、業務プロセスをデータに写像する
    必要があるなと思い、データモデリングに注力しました
    4 理想には、まだまだ遠いです
    まとめ

    View full-size slide

  21. 21
    1
    2
    3
    組織づくり:業務・システム変化を報連相する横断的組織作り
    維持体制:ドキュメント(モデル)が腐らないような維持体制
    データ活用の文化醸成:結局使ってもらえなければ意味がない
    4 仲間が足りない!!(絶賛仲間を募集中)
    課題

    View full-size slide

  22. 22
    課題+:
    • データモデリングは銀の弾丸ではない
    • ただし、データ活用を推進する上での課題解決にはつながりそう
    • 得られるメリットに比例して、労力がかかるので長期的かつ継続的な
    活動と捉えるのがよさそう

    View full-size slide

  23. 23
    Appendix
    How to Prepare
    Data Modeling

    View full-size slide

  24. そもそも、データモデリングとは何か、すごく簡単に説明します
    • データモデリングとは、データに関する要件の明確化や、実装範囲の決定を目的に、
    データモデルを作成すること
    • ここでいうデータモデルとは、あらかじめ定めた様式に従ってデータの名称や定義、デー
    タ同士の関係性などを記述したもの
    定義
    想定成果物
    • 概念データモデル:企業の現実をそのまま写し取ったモデル
    • 論理データモデル:概念データモデルにデータ要件(主要属性や関係性)を追加
    したモデル
    • 物理データモデル:論理データモデルをベースにシステム実装を想定した詳細モデル
    • データ定義書とその作成プロセス
    ※データ定義:ドメイン定義、エンティティ定義、データ項目定義、コード定義、
    コード値定義の総称
    (business)
    Metadata

    View full-size slide

  25. そもそも、データモデリングとは何か、すごく簡単に説明します
    参照:概念・論理・物理データモデルの違いは人によって異なる?データ総研の考え方をご紹介
    https://jp.drinet.co.jp/blog/modeling_dri
    概念
    論理
    物理
    目安:経営者がみてわかる
    目安:業務担当者がみてわかる
    目安:システム担当者がみてわかる

    View full-size slide

  26. まず、お手元にご用意いただくものは、各事業(部)のBPMN図
    企業様
    営業
    アドバイザー
    面接
    契約
    求人要件
    ヒアリング
    求職者様の
    ご紹介
    問い合わせ 決定
    請求
    BPMNがない場合は、ビジネスサイドと「一緒に作りましょう」が第一歩?
    No 業務リスト
    1 問い合わせ対応
    2 契約
    3 求人要件のヒアリング
    4 求職者様のご紹介
    5 進捗確認
    6 請求
    1 BPMN図から業務リスを作成

    View full-size slide

  27. まず、お手元にご用意いただくものは、各事業(部)のBPMN図
    企業様
    営業
    アドバイザー
    企業様
    営業
    アドバイザー
    No 業務リスト 業務リストの詳細化 業務上利用しているシステム
    1 問い合わせ対応 メール
    2 契約 2-1顧客IDの発行 基幹システムAの●●画面
    (例えば顧客管理画面など)
    2-2顧客情報の登録 基幹システムA××画面
    3 求人要件のヒアリング 営業ツール
    4 求職者様のご紹介 基幹システムB
    5 進捗確認 営業ツール
    6 請求 決済システム
    2 業務リストをもとにビジネスサイドにヒアリング。リストの詳細化とデータ生成元システムの確認

    View full-size slide

  28. まず、お手元にご用意いただくものは、各事業(部)のBPMN図
    企業様
    営業
    アドバイザー
    営業
    アドバイザー
    No 業務リスト 業務リストの詳
    細化
    業務上利用してい
    るシステム
    2 契約 2-1顧客IDの発

    基幹システムAの
    ●●画面
    2-2顧客情報の
    登録
    基幹システムAの
    ××画面
    3 業務上利用しているシステムの、I/Oをヒアリング
    実際に画面を見せてもらいます
    ここでの入力項目=「業務データの生成元」
    メイン業務で利用している画面の入力項目をリスト化していきます
    基幹システムAの●●画面

    View full-size slide

  29. まず、お手元にご用意いただくものは、各事業(部)のBPMN図
    企業様
    営業
    アドバイザー
    No 業務リス

    業務リストの
    詳細化
    業務上利用して
    いるシステム
    入力項目一覧 テーブル名 物理カラム名
    2 契約 2-1顧客IDの
    発行
    基幹システムA
    の●●画面
    法人●●ID Table_001 YYYY
    契約年月 Table_100 XXXX
    契約タイプ a_table_09 AAAA
    契約者情報 b_table_08 ZZZZ
    更新年月 c_table_010 DDDD
    4 主要画面の入力項目をリスト化し、既存DB上のデータテーブルとカラムと照合していきます

    View full-size slide

  30. まず、お手元にご用意いただくものは、各事業(部)のBPMN図
    企業様
    営業
    アドバイザー
    No 業務リス

    業務リストの
    詳細化
    業務上利用して
    いるシステム
    入力項目一覧 物理カラム名 データ項目定義
    2 契約 2-1顧客IDの
    発行
    基幹システムA
    の●●画面
    法人●●ID YYYY 新規契約した顧客に
    システムから発番さ
    れる7桁のコードです。
    重複はありません。
    契約年月 XXXX
    契約タイプ AAAA
    契約者情報 ZZZZ
    更新年月 DDDD
    5 以下のリストに、データ定義(ドメイン定義、エンティティ定義、データ項目定義、コード定義、
    コード値定義)を追記していきます(ここまではまだ、できていません‥‥)

    View full-size slide

  31. まず、お手元にご用意いただくものは、各事業(部)のBPMN図
    企業様
    営業
    アドバイザー
    6 業務リストに対応して、これら調査を実施していきます。
    正直めちゃくちゃ大変ですが、メイン業務を押さえると山を越えた!という感じになっていきます
    No 業務リスト 業務詳細化 業務シ
    ステム
    入力項目 テーブル名 カラム名 データ定義
    1 問い合わせ対

    2 契約
    3 求人要件のヒ
    アリング
    4 求職者様のご
    紹介
    5 進捗確認
    6 請求
    これらを抽出したら、いざデータモデリングへ!
    概念データモデルから物理データモデリングまで一気通貫で進めます
    (データ定義はめちゃくちゃ大変なので、データモデリングが終わっ
    たら、対応していきます)

    View full-size slide

  32. まず、お手元にご用意いただくものは、各事業(部)のBPMN図
    企業様
    営業
    アドバイザー
    7 メタデータの収集・管理&データ統合のために、troccoのPoCをはじめました!

    View full-size slide