Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LayerX Privacy Tech事業部紹介 Tech編

Avatar for Osuke Osuke
September 13, 2022

LayerX Privacy Tech事業部紹介 Tech編

Avatar for Osuke

Osuke

September 13, 2022
Tweet

More Decks by Osuke

Other Decks in Technology

Transcript

  1. 2 CONFIDENTIAL: © LayerX Inc. 自己紹介 • Osuke(須藤 欧佑) •

    Privacy Tech事業部 エンジニア • LayerX創業期から主にプライバシー分野での R&Dをしつつ、現在はプロダクト開発やインフ ラの設計・構築あたりをメインに取り組んでい ます。 • 今年6月に長男が誕生し、育児と両立しながら頑 張っています。
  2. 3 CONFIDENTIAL: © LayerX Inc. 技術面に関わる主な業務 • 現状は、devメンバーがそれぞれ横断して取り組んでいる データ分析 •

    有用性を分析・評価しながら試行錯誤し、 最終的にユースケースに合わせた適切なプ ライバシー保護手法を適用する • そもそもデータにどんな価値やユースケー スがあり、そのサービス化にはどういう統 計・機械学習の手法を用いるのが良いか設 計する プロダクト開発 • プロダクトのコアとなる価値を検証しなが ら、本番システムの設計・開発をする • 選定したプライバシー保護手法やクエリを アプリケーションに実装する R&D • 学術的なプライバシー保護の理論や手法に 基づき、ユースケースに合わせた適切な手 法を選定し、必要に応じて既存手法を改善 する データOps・データエンジニアリング • 社内のデータ分析基盤を改善し、セキュリ ティを十分に保証しつつチームの生産性を 高める
  3. 7 CONFIDENTIAL: © LayerX Inc. プロジェクトごとのデータ基盤高速セットアップ • 適切なセキュリティ保護をしつつプロジェクト開始に向けたセットアップを高速化するのが肝 • Terraform

    ModuleやGithub ActionsのReusable workflowを積極的に活用し、プロジェクトごとの データ基盤セットアップを高速化し誰がセットアップしても適切なセキュリティ保護や権限管理が適用 される プロジェクトごとに 数行設定項目を記述するだけで 各種必要なインフラセットアップ(BigQueryデー タセットや権限周り)が完了 Terraform Moduleの例
  4. 8 CONFIDENTIAL: © LayerX Inc. dbtとは • ELTクエリへのレビューコメントをどうつ ければいい・・? •

    GithubのPRベースでレビュー実施 • Github Actionsで自動的にテーブル&ド キュメント生成 • このテーブルってどのテーブルからどう いうクエリで生成されたんだっけ・・? • dbt docsでデータリネージを可視化 • テーブルごとにDDLをドキュメント化 • このSQLクエリにミスはない・・? • SQL自体を細かくファイル分割し、テス トSQLもdbtで管理 • DWH上でのELTを管理・実行するためのツール 課題 ソリューション
  5. 10 CONFIDENTIAL: © LayerX Inc. dbtとは • ELTクエリへのレビューコメントをどうつ ければいい・・? •

    GithubのPRベースでレビュー実施 • Github Actionsで自動的にテーブル&ド キュメント生成 • このテーブルってどのテーブルからどう いうクエリで生成されたんだっけ・・? • dbt docsでデータリネージを可視化 • テーブルごとにDDLをドキュメント化 • このSQLクエリにミスはない・・? • SQL自体を細かくファイル分割し、テス トSQLもdbtで管理 • DWH上でのELTを管理・実行するためのツール 課題 ソリューション
  6. 12 CONFIDENTIAL: © LayerX Inc. dbtとは • ELTクエリへのレビューコメントをどうつ ければいい・・? •

    GithubのPRベースでレビュー実施 • Github Actionsで自動的にテーブル&ド キュメント生成 • このテーブルってどのテーブルからどう いうクエリで生成されたんだっけ・・? • dbt docsでデータリネージを可視化 • テーブルごとにDDLをドキュメント化 • このSQLクエリにミスはない・・? • SQL自体を細かくファイル分割し、テス トSQLもdbtで管理 • DWH上でのELTを管理・実行するためのツール 課題 ソリューション
  7. 15 CONFIDENTIAL: © LayerX Inc. プロダクト開発における課題 • いかにデータやユースケースにとらわれずクエリやアプリケーションの汎用化ができる か ◦

    ナイーブにはデータやユースケースに合わせて都度分析クエリやテストクエリを考え る必要がある • いかにさまざまな分析の切り口を比較してユースケースに応じて最適なプライバシー保 護とデータ生成を実行できるか • いかに大規模データに対し現実的な実行時間内で良いユーザー体験をもたらしデータに 対するインサイトを提供できるか …