Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Amebaのデータマネジメント戦略 : 地道な実践と進化の軌跡

CyberAgent
December 10, 2023
330

Amebaのデータマネジメント戦略 : 地道な実践と進化の軌跡

データを適切に活用するためには、データマネジメントが欠かせません。しかし、そのために必要な取り組みは非常に多岐にわたり、無計画に進めることはできません。AmebaのデータマネジメントチームはDMBOKを基本方針として採用し、それに独自の解釈を加えて取り組みを進めてきました。データマネジメントの取り組みを進化させデータの活用を強化するためにどのように取り組んできたのか、地道ながらも面白い活動の軌跡についてご紹介いたします。

CyberAgent

December 10, 2023
Tweet

More Decks by CyberAgent

Transcript

  1. 加藤 寿明(かとう ひさあき) 自己紹介 • 2023年03月中途入社 • Amebaでデータマネジメント • 好きなもの:お酒

    / 料理 / 旅行 株式会社サイバーエージェント > メディア統括本部 > Data Science Center (DSC) @hisaaki__k
  2. データマネジメント業務は幅広い 01. データガバナンス 02. データアーキテクチャ 03. データモデリング 04. データ統合と相互運用性 05.

    データストレージとオペレーション 06. データウェアハウジングとBI 07. 参照データとマスターデータ 08. データ品質 09. ドキュメントとコンテンツとメタデータ※ 10. データセキュリティ ※ 独自解釈による
  3. データは利用されて初めて価値を生む • データ利用者の満足度 (利便性) に直結する領域は注力 した方が良さそう • 言い換えればこれは成果の見えやすさでもある   データマネジメントの成果をアピールしやすい

    例. データ統合 データを使いたい時に使いやすく利用するためには移動の管理は必須。 恩恵を受ける利用者も多かった。 1. データ利用者の観点
  4. 2. DMBOKの成熟度観点 成熟度の観点 レベル0 遂行能力がない状態 レベル1 場当たり的な状態 レベル2 標準化された状態 レベル3

    自動化された状態 レベル4 拡張可能な状態 情報公開 わからない 公開されていない 公開されている 自動化について公開されている 他の事業で実施できている 情報理解 わからない 1人以上が把握できている データ活用者が把握できている 自動化がデータ活用者が把握でき ている 他の事業で実施できている 再現性 わからない ない(属人的) データ活用者が反復可能、再現可 能。 自動化される (成果物が自動生成される) 他の事業で実施できている 責任の所在 わからない 明確ではない 明確になっている 自動化について明確になっている 他の事業で実施できている ニーズ わからない 明確ではない 整理され、ガバナンスと関連づけ られている 自動化について整理され、ガバナ ンスと関連づけられている 他の事業で実施できている 育成 わからない 自ら調べることができず誰かに問 い合わせが必要 活用者が自ら調べることができる 自動化について活用者が自ら調べ ることができる 他の事業で実施できている 技術 わからない ツールの標準機能など何かが実施 できる状態 技術選定をして必要なことが実施 できる状態 自動化について技術選定をして必 要なことが実施できる状態 精度を上げるための取り組みがで きている状態 独自の成熟度レベル※に従って現状を分析 ※セッション3: 「データ活用で事業貢献するためのデータマネジメント立ち上げ」にて詳しく
  5. ツール案 • GCP製品 ◦ Cloud Composer ◦ Cloud Dataflow •

    内製 ◦ 全社データ基盤チームが開発していた新バッチ処理システム 1. 統合管理できるツールの導入
  6. ツール案 • GCP製品 → オンプレHiveが扱いづらい ◦ Cloud Composer ◦ Cloud

    Dataflow • 内製 → (管理主体が別チームだが) ツール統合できて利点も多い ◦ 全社データ基盤チームが開発していた新バッチ処理システム 1. 統合管理できるツールの導入