Upgrade to Pro — share decks privately, control downloads, hide ads and more …

DataOps実現への道筋 持続可能な運用体制の構築 / journey-to-dataops

Avatar for pei0804 pei0804
July 29, 2024

DataOps実現への道筋 持続可能な運用体制の構築 / journey-to-dataops

データ利活用のミソ DataOps実現のための取り組みとは? Lunch LT
https://findy.connpass.com/event/323727/

Avatar for pei0804

pei0804

July 29, 2024
Tweet

More Decks by pei0804

Other Decks in Technology

Transcript

  1. 効果的だった5つの施策 1. ツールの導入 2. データオーナーの確立 3. Slackチャンネルの再設計 4. データ品質向上 5.

    Playbookの整備 実際のDataOpsの推進施策は、この順番で進めました。 なぜこの順番なのかは、それぞれのセクションで説明します。
  2. 実際に行ったSlackチャンネルの再設計 • 基盤チーム向け(#info, #warning, #error, #emegency) ◦ 目的 ▪ システム全体の把握を素早くできる。

    ◦ 効果 ▪ 基盤チームに特化した作りにできるようになった。 • 役割が曖昧な時はオーナーへのノイズを気にしていた。 • データオーナー向け(#data_monitoring) ◦ 目的 ▪ モデル関連問題を一元管理。 ◦ 効果 ▪ ここだけ見ればいい状態になり、情報の取捨選択が簡素化。 ▪ チーム間のナレッジシェア。
  3. 基本的なデータ整合性の検証 dbt generic data test dbtのgeneric data testは基本的なデータ品質保証の要です。 特にビジネスキーに対するuniqueとnot_nullテストは必須であり、 これだけでも多くのデータ問題(ファントラップ等)を防げます。

    弊社だと、全カラムへの網羅的なテスト適用はコスト効率が悪いため、 ビジネス上クリティカルな部分に焦点を当てるようにしています。 ※事業特性に応じて適切に判断しましょう。