Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データチームを率いる現場マネージャーが語る、市場が求めるデータエンジニアに爆速で成長する方法
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Takaya Nakanishi
September 28, 2022
Technology
830
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
データチームを率いる現場マネージャーが語る、市場が求めるデータエンジニアに爆速で成長する方法
2022年9月27日に開催した Cloud Native DataEngineer Community での登壇資料です。
Takaya Nakanishi
September 28, 2022
More Decks by Takaya Nakanishi
See All by Takaya Nakanishi
AI がコードを書く時代で エンジニアであるために - ハーネスエンジニアリングの、その先へ
kc_nakanishi
0
130
DAIS 2025 で感じた データ + AI の“イマ”
kc_nakanishi
1
470
Databricks Data+AI Summit 2024 最新動向座談会
kc_nakanishi
0
340
20240330_LT資料「エンジニアに求められるマネジメント」
kc_nakanishi
2
400
ナレコム CULTURE DECK
kc_nakanishi
1
2.3k
AI業界をリードする企業のエンジニアが語る:クラウド & AI でキャリアを作る魅力
kc_nakanishi
1
500
受託クラウド AI ベンチャーで働く自分から見た 誰も言わない成功プロジェクトの共通点
kc_nakanishi
0
410
ChatGPTがある時代にわたしたちはどう生きるか
kc_nakanishi
2
250
「AWS 上で始めるモダンデータアアーキテクチャと データ活用に向けたアプローチ」
kc_nakanishi
0
780
Other Decks in Technology
See All in Technology
起点・思考・出力で分解する 〜PM業務の自動化設計〜
kazu_kichi_67
1
1.1k
徹底討論!ECS vs EKS!
daitak
3
1.7k
時期が悪い!それでもRaspberry Piを買って遊んで活用するには / 20260627-osc26do-rpi-jikigawarui
akkiesoft
0
820
AIをフル活用してオンコール機能のプロトタイプを2日で作った話 / Building an AI-Powered On-Call Prototype in Just Two Days
nari_ex
0
130
クレデンシャル流出 ― 攻撃 3 時間 vs 復旧 10 時間。この非対称性にどう備えるか
kazzpapa3
3
560
AI 不只幫你寫 Code: 當專案從 300 暴增到 1500, 我們如何撐住 DevOps
appleboy
0
230
螺旋型キャリアの生存戦略 / kinoko-conf2026
rakus_dev
1
990
作る力から、見極める力へ — AI時代に広がるエンジニアの価値と役割
rince
0
340
Oracle Cloud Infrastructure:2026年6月度サービス・アップデート
oracle4engineer
PRO
0
320
AIに障害切り分けを全部やってもらった。 。 。 。
estie
0
160
LayerX コーポレートエンジニアリング室におけるサプライチェーンセキュリティへの取り組み / Supply Chain Security at LayerX Corporate Engineering
yuyatakeyama
3
840
iOS アプリの「これって不具合ですか?」を AI に調べてもらう
miichan
0
140
Featured
See All Featured
HDC tutorial
michielstock
2
720
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
190
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
2
220
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
2
400
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.5k
KATA
mclloyd
PRO
35
15k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
330
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
2k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
4 Signs Your Business is Dying
shpigford
187
22k
RailsConf 2023
tenderlove
30
1.5k
New Earth Scene 8
popppiees
3
2.4k
Transcript
データチームを率いる現場マネージャーが語る、 市場が求めるデータエンジニアに爆速で成長する方法 株式会社ナレッジコミュニケーション ビジネス・デベロップメント部 中西 貴哉 2022年9月27日 Cloud Native DataEngineer
Community 第1回イベント
自己紹介 氏名 : 中西 貴哉 (なかにし たかや) 所属 : ビジネス・デベロップメント部
マネージャー (何でもやる) 担当 : セールス-運用までのエンジニアリングチームのマネジメント 2 データエンジニアを目指す方にオススメな資格 (自分が保有しているもの)
1 2 3 Agenda データエンジニアの ニーズ クラウドネイティブ になるメリット 経験 をどう獲得するか?
3
市場が求めるデータエンジニアになる3つのキーワード クラウド 経験 ニーズ 4
ニーズ
データプロジェクトの実情 6 85% のビッグデータプロジェクトは失敗 実は・・・
7 ML code データ収集 データ検証 環境構築 自動化 特徴量エンジニアリング テストと デバッグ
モデル評価 プロセス設計 モデル提供 インフラ構築 メタデータ管理 リソース マネジメント Hidden Technical Debt in Machine Learning Systems (Sculley et al. 2015) より作成 「分析」そのものは全体のごく一部
データプロジェクトの登場人物 8 ▪ コラボレーション、機械学習の実 験、再現性・再利用性を担保 ▪ データプレパレーション、特徴量 抽出 ▪ 機械学習時間、モデル精度に
対する最適化 ▪ 最新のツールや最新アルゴリズ ムの導入と適用 ▪ 常に正確で信頼できる最新 データにアクセスすることを担保 ▪ データチームがアクセスするデータ の定義と管理者の明確化を推 進 ▪ データガバナンスの統合的な管 理を推進 ▪ 各プロセス処理の動作担保 ▪ 各種ユースケースへの対応 (リア ルタイム, バッチ) ▪ 性能、データ品質の担保 ▪ 新しいデータソースへの対応 ▪ スキーマチェックとカラム変更時の 対応 ▪ 変更時のデプロイ先アプリへの対 応 ▪ ニーズに合わせた環境構築 ▪ 環境ごとの一貫性の担保 ▪ コアデータの複数チームへの共有 ▪ テスト、ダウンタイム、品質管理 ▪ 各種コンフィギュレーション管理 ▪ コスト管理、各種自動化 ▪ システム環境の運用保守 データ/MLエンジニア データスチュアード 運用管理担当 データサイエンティスト
9 ML code データ収集 データ検証 環境構築 自動化 特徴量エンジニアリング テストと デバッグ
モデル評価 プロセス設計 モデル提供 インフラ構築 メタデータ管理 リソース マネジメント Hidden Technical Debt in Machine Learning Systems (Sculley et al. 2015) より作成 広範な技術領域をカバーする必要がある データ/MLエンジニア データサイエンティスト 運用管理担当 運用管理担当 データスチュアード
実際のところ・・・ 10 ML code データ収集 データ検証 環境構築 自動化 特徴量エンジニアリング テストと
デバッグ モデル評価 プロセス設計 モデル提供 インフラ構築 メタデータ管理 リソース マネジメント Hidden Technical Debt in Machine Learning Systems (Sculley et al. 2015) より作成 データ/MLエンジニア
クラウド
なぜクラウドネイティブか? 12 ML code データ収集 データ検証 環境構築 自動化 特徴量エンジニアリング テストと
デバッグ モデル評価 プロセス設計 モデル提供 インフラ構築 Hidden Technical Debt in Machine Learning Systems (Sculley et al. 2015) より作成 リソース マネジメント メタデータ管理
クラウドの理解と活用で大半はカバー可 13 ML code データ収集 データ検証 環境構築 自動化 特徴量エンジニアリング テストと
デバッグ リソース マネジメント モデル評価 プロセス設計 モデル提供 インフラ構築 メタデタ管理 メタデータ管理 Hidden Technical Debt in Machine Learning Systems (Sculley et al. 2015) より作成
クラウドネイティブで始めるメリット 14 「答え」が提供されている 価値のある課題に集中できる
アーキテクチャの模範解答 15 Azure Machine Learning を使用した Python モデル用の MLOps AWS
ソリューションライブラリー MLOps Workload Orchestrator AWS Azure
ビジネス領域へのアプローチ 16 製薬 流通 流通 All All All All All
金融 金融 製造 金融 製造 通信 公共 製薬 製薬 All All All All All All 金融 All データブリックス社の公開するソリューションアクセラレータ 現場の分析アプローチが Notebook 形式で公開
経験
不確実性の高い時代に求められる学び 18 これまで これから 絶対解 知識の蓄積 計画的な学習 資格取得 最適解 知識の更新
スピード学習 ラーニング
市場価値を上げる人のアプローチ 経 験 多 少 少 多 学習の量 経験偏重 発展途上
学習偏重 成長する 働き方 仕事から学び 学 び か ら 仕 事
どんな経験も活かせます 20 経験 活きる場面 営業 運用 数理知識 ドメイン理解 MLOps モデル開発
チーム内での経験と学習の両立 21
まとめ クラウドネイティブになれる データプロジェクトに飛び込もう!
カジュアル面談やってます エントリーページ