Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LayerX Privacy Tech事業部紹介 Tech編
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Osuke
September 13, 2022
Technology
260
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LayerX Privacy Tech事業部紹介 Tech編
Osuke
September 13, 2022
More Decks by Osuke
See All by Osuke
特許データを使ったマルチモーダルAIの検証事例@LLMProd#4
osuke
0
340
dbtを中心に据えた データ分析とプロダクト開発
osuke
1
1.2k
(SCIS2021) Anonify: プライバシーを保護した 検証可能な状態遷移モジュール
osuke
1
450
Rustで実装された AWS Nitro Enclaves CLIを読む
osuke
0
430
Rustのパフォーマンスに関するTips
osuke
4
4.8k
ARM TrustZone入門 / ARM TrustZone intro
osuke
21
10k
Anonify
osuke
3
1.2k
Rustのasync/awaitとスケジューラの話 / rust-async-await
osuke
9
4.2k
Privacy on Blockchain
osuke
1
1.3k
Other Decks in Technology
See All in Technology
AI時代のコスト管理を考えよう〜明日から使える実践AWSノウハウ~
yoshimi0227
0
910
アラート調査向けAIエージェントの本番導入とその後/AI Agents for Alert Investigation: Production Deployment and After
taddy_919
1
190
從開發到部署全都交給 AI:實作 AI 驅動的自動化流程
appleboy
0
170
元・セキュリティ学習経験0大学生による業務紹介 / An Introduction to the Job by a Former College Student with Zero Security Training Experience
nttcom
0
540
2026 AI Memory Architecture
nagatsu
0
450
5分でわかる Amazon Connect_20260608
hwangbyeonghun
0
120
WebGIS AI Agentの紹介
_shimizu
0
570
AI Agentをシステムに組み込む前にゆるく向き合ってみる
hayama17
0
160
PostgreSQL 19 新機能概要 OSC Hokkaido 2026
nori_shinoda
0
250
初めてのDatabricks勉強会
taka_aki
2
160
ぼっちではじめた登壇が「51名」「241件」の発信に化けた
subroh0508
1
320
不要なレビューをAIにまかせて AIコーディングの環境改善を加速した
shoota
1
270
Featured
See All Featured
New Earth Scene 8
popppiees
3
2.4k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
430
A designer walks into a library…
pauljervisheath
211
24k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
210
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
280
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
SEO for Brand Visibility & Recognition
aleyda
0
4.6k
Code Review Best Practice
trishagee
74
20k
Ethics towards AI in product and experience design
skipperchong
2
310
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Darren the Foodie - Storyboard
khoart
PRO
3
3.4k
Transcript
1 Privacy Tech事業部紹介 Tech編 LayerX Inc.
2 CONFIDENTIAL: © LayerX Inc. 自己紹介 • Osuke(須藤 欧佑) •
Privacy Tech事業部 エンジニア • LayerX創業期から主にプライバシー分野での R&Dをしつつ、現在はプロダクト開発やインフ ラの設計・構築あたりをメインに取り組んでい ます。 • 今年6月に長男が誕生し、育児と両立しながら頑 張っています。
3 CONFIDENTIAL: © LayerX Inc. 技術面に関わる主な業務 • 現状は、devメンバーがそれぞれ横断して取り組んでいる データ分析 •
有用性を分析・評価しながら試行錯誤し、 最終的にユースケースに合わせた適切なプ ライバシー保護手法を適用する • そもそもデータにどんな価値やユースケー スがあり、そのサービス化にはどういう統 計・機械学習の手法を用いるのが良いか設 計する プロダクト開発 • プロダクトのコアとなる価値を検証しなが ら、本番システムの設計・開発をする • 選定したプライバシー保護手法やクエリを アプリケーションに実装する R&D • 学術的なプライバシー保護の理論や手法に 基づき、ユースケースに合わせた適切な手 法を選定し、必要に応じて既存手法を改善 する データOps・データエンジニアリング • 社内のデータ分析基盤を改善し、セキュリ ティを十分に保証しつつチームの生産性を 高める
4 CONFIDENTIAL: © LayerX Inc. 技術スタック データ分析 プロダクト開発
5 CONFIDENTIAL: © LayerX Inc. データ分析プロジェクトの大まかな流れ(一例) ①プロジェクトごとのデータ基盤セットアップ ②ユースケースの洗い出し・要件定義・技術検証 ③データ分析 ④プライバシー保護技術を適用しデータ生成
6 CONFIDENTIAL: © LayerX Inc. データ分析プロジェクトにおけるデータ基盤概要(インフラ) • DWHはBigQueryを活用し、その他のワークロードはAWSに寄せる設計
7 CONFIDENTIAL: © LayerX Inc. プロジェクトごとのデータ基盤高速セットアップ • 適切なセキュリティ保護をしつつプロジェクト開始に向けたセットアップを高速化するのが肝 • Terraform
ModuleやGithub ActionsのReusable workflowを積極的に活用し、プロジェクトごとの データ基盤セットアップを高速化し誰がセットアップしても適切なセキュリティ保護や権限管理が適用 される プロジェクトごとに 数行設定項目を記述するだけで 各種必要なインフラセットアップ(BigQueryデー タセットや権限周り)が完了 Terraform Moduleの例
8 CONFIDENTIAL: © LayerX Inc. dbtとは • ELTクエリへのレビューコメントをどうつ ければいい・・? •
GithubのPRベースでレビュー実施 • Github Actionsで自動的にテーブル&ド キュメント生成 • このテーブルってどのテーブルからどう いうクエリで生成されたんだっけ・・? • dbt docsでデータリネージを可視化 • テーブルごとにDDLをドキュメント化 • このSQLクエリにミスはない・・? • SQL自体を細かくファイル分割し、テス トSQLもdbtで管理 • DWH上でのELTを管理・実行するためのツール 課題 ソリューション
9 CONFIDENTIAL: © LayerX Inc. dbt docs • BigQuery上の全てのテーブル・ビューのメタデータはdbt docsで社内向けに閲覧可能に
https://docs.getdbt.com/docs/building-a-dbt-project/documentation
10 CONFIDENTIAL: © LayerX Inc. dbtとは • ELTクエリへのレビューコメントをどうつ ければいい・・? •
GithubのPRベースでレビュー実施 • Github Actionsで自動的にテーブル&ド キュメント生成 • このテーブルってどのテーブルからどう いうクエリで生成されたんだっけ・・? • dbt docsでデータリネージを可視化 • テーブルごとにDDLをドキュメント化 • このSQLクエリにミスはない・・? • SQL自体を細かくファイル分割し、テス トSQLもdbtで管理 • DWH上でのELTを管理・実行するためのツール 課題 ソリューション
11 CONFIDENTIAL: © LayerX Inc. データの品質保証 • 満たすべき必要条件や具体的なインプット値とアウトプット値の条件に対してSQLテスト https://docs.getdbt.com/guides/lega cy/writing-custom-generic-tests
12 CONFIDENTIAL: © LayerX Inc. dbtとは • ELTクエリへのレビューコメントをどうつ ければいい・・? •
GithubのPRベースでレビュー実施 • Github Actionsで自動的にテーブル&ド キュメント生成 • このテーブルってどのテーブルからどう いうクエリで生成されたんだっけ・・? • dbt docsでデータリネージを可視化 • テーブルごとにDDLをドキュメント化 • このSQLクエリにミスはない・・? • SQL自体を細かくファイル分割し、テス トSQLもdbtで管理 • DWH上でのELTを管理・実行するためのツール 課題 ソリューション
13 CONFIDENTIAL: © LayerX Inc. プライバシー保護されたデータ生成 • データ分析結果を元に差分プライバシーのノイズをデータに付与する • OSSがいくつか存在するが、Google
DPやPyDP(Google DPのPython Wrapper)を利用することが 多い https://github.com/google/differential-privacy
14 CONFIDENTIAL: © LayerX Inc. プロダクト開発 • ここまでのデータ分析フローをソフトウェアで自動化できたら楽では・?? -> プライバシー保護したデータを継続的・効率的に外部提供することが可能な、Anonifyを組み込んだ
データ加工・抽出基盤
15 CONFIDENTIAL: © LayerX Inc. プロダクト開発における課題 • いかにデータやユースケースにとらわれずクエリやアプリケーションの汎用化ができる か ◦
ナイーブにはデータやユースケースに合わせて都度分析クエリやテストクエリを考え る必要がある • いかにさまざまな分析の切り口を比較してユースケースに応じて最適なプライバシー保 護とデータ生成を実行できるか • いかに大規模データに対し現実的な実行時間内で良いユーザー体験をもたらしデータに 対するインサイトを提供できるか …
16 CONFIDENTIAL: © LayerX Inc. 「最初の10人」になってください!