Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Data Engineering Study #9 Classiのデータ組織の歩み
Search
tetsuroito
August 03, 2021
Business
5
5.9k
Data Engineering Study #9 Classiのデータ組織の歩み
Data Engineering Study #9「企業規模別に見る、データエンジニア組織の作り方」での発表資料
tetsuroito
August 03, 2021
Tweet
Share
More Decks by tetsuroito
See All by tetsuroito
Data Engineering Study#30 LT資料
tetsuroito
2
1.3k
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.8k
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
860
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
1
650
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
4.9k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
140
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.5k
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
2k
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて
tetsuroito
3
3.3k
Other Decks in Business
See All in Business
【会社紹介資料】株式会社エーピーコミュニケーションズ
apcom
0
5.5k
株式会社あるよ_会社紹介資料20250808.pdf
aruyo_mori
0
3.9k
ファブリカホールディングス_2026年3月期第1四半期説明資料
fabrica_com
1
4k
「なんとなく使いにくい」を論理的に説明する方法 〜プロダクトエンジニアとしてUXを議論できる第一歩〜
mkitahara01985
0
400
タケウチグループRecruit
takeuchigroup
0
7.5k
エスキュービズム 会社紹介資料
human_resources
2
20k
Seibii(セイビー) 会社概要資料 | Company Deck
seibii2019
0
590
うまく伝わらない「当事者意識」という期待 / Fuzzy ownership
taguchimasahiro
1
110
営業職/新卒向け会社紹介資料(テックファーム株式会社)
techfirm
1
900
AIで変わるPdMの役割──思考する力が武器になる
itsukikacky
18
13k
2025年12月期 第二四半期決算説明資料
mobcast20040326
PRO
0
480
"遠くて近い"チームをつくる──リモートワークで「開発現場に必要とされる人材」になる方法
cysphere
0
200
Featured
See All Featured
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
780
Documentation Writing (for coders)
carmenintech
73
5k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
7
820
Navigating Team Friction
lara
189
15k
A Modern Web Designer's Workflow
chriscoyier
695
190k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.4k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.8k
What's in a price? How to price your products and services
michaelherold
246
12k
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.4k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Transcript
Copyright © 2021 Classi Corp. All Rights Reserved. Data Engineering
Study #9 企業規模別に見るデータエンジニア組織の作り方 2021/08/03(火) Classi株式会社 データAI部 部長 伊藤徹郎 Classiのデータ組織の歩み
Copyright © 2021 Classi Corp. All Rights Reserved. 自己紹介 •
名前:伊藤 徹郎 (@tetsuroito) • 所属:Classi株式会社 データAI部 • 役職:部長 • 分野:Educational Technology , Learning Analytics • 著書 ◦ データサイエンティスト養成読本ビジネス活用編 ◦ AI・データ分析プロジェクトのすべて 1
Copyright © 2021 Classi Corp. All Rights Reserved. 自己紹介 2
昨年のData Engineering Study #3 「分析基盤をうまく組織に浸透させる方法」 でもお話をさせていただきました https://www.youtube.com/watch?v=IC44rPbYA4s
Copyright © 2021 Classi Corp. All Rights Reserved. アジェンダ •
会社概要 • データ組織の紹介 • データ組織のプラクティスの紹介 3
Copyright © 2021 Classi Corp. All Rights Reserved. アジェンダ •
会社概要 • データ組織の紹介 • データ組織のプラクティスの紹介 4
Copyright © 2021 Classi Corp. All Rights Reserved. 5 Classiの会社概要
https://speakerdeck.com/classijp/we-are-hiring より
Copyright © 2021 Classi Corp. All Rights Reserved. 6 Classiのミッション・ビジョン・バリュー
https://speakerdeck.com/classijp/we-are-hiring より 子供の無限の可能性を解き放ち、学びの形を進化させる 先生とともに、学びから学ぶ仕組みを創り、 ワクワクする子どもを増やします • Unlearn & Learn • Love Difference • Make Happen ⁃ 既存の知識を外す勇気。「学び方」を学び続けよう。 失敗してもいい。新しい学びに挑戦しよう。 ⁃ 違いを愛そう。チームを超えて協働しよう。 多様性こそClassiの強み。多様な方がわくわくする。 ⁃ 共に作り、共に実現する。大切なのは、信じて、 やり抜くこと。 Value Mission Vision
Copyright © 2021 Classi Corp. All Rights Reserved. 7 Classiのサービス
https://speakerdeck.com/classijp/we-are-hiring より
Copyright © 2021 Classi Corp. All Rights Reserved. 8 サービス導入実績
https://speakerdeck.com/classijp/we-are-hiring より
Copyright © 2021 Classi Corp. All Rights Reserved. アジェンダ •
会社概要 • データ組織の紹介 • データ組織のプラクティスの紹介 9
Copyright © 2021 Classi Corp. All Rights Reserved. 10 組織体制
データチーム https://speakerdeck.com/classijp/we-are-hiring より
Copyright © 2021 Classi Corp. All Rights Reserved. 11 組織規模
部門内訳 開発本部職種内訳 開発本部 41% サイバーセキュリティ 6% コーポレート 13% マーケ ティング 本部 21% 合計 81名 サーバー エンジニア 48% データエンジニア 2% アプリ エンジニア 11% フロント エンジニア 11% プロダクト デザイン 本部 15% その他 8% QA 9% その他 6% SRE 5% データサイエンティスト 5% Pythonエンジニア 2% 合計 202 名 プロダクトマネジメント部 2% データ系職種 https://speakerdeck.com/classijp/we-are-hiring より
Copyright © 2021 Classi Corp. All Rights Reserved. 12 データ組織の職能と役割
職種 役割 体制 データサイエンティスト モデル開発・運用・分析 データ活用推進 ダッシュボード構築・運用 R&D データエンジニア データ基盤開発・運用 データ活用推進 クラウドセキュリティ Admin Pythonエンジニア MLプロダクト開発・運用 データ活用推進 クラウドセキュリティ
Copyright © 2021 Classi Corp. All Rights Reserved. データ基盤の構成図
13 出典:Classiのデータ分析基盤であるソクラテスの紹介 https://tech.classi.jp/entry/2021/05/31/120000
Copyright © 2021 Classi Corp. All Rights Reserved. • 提供サービスのDBデータ
• 各種サービス利用データ • テキストデータ • 数値データ • アクセスログ • Google AnalyticsやFirebase Analytics • アプリケーションログ • 3rd Partyデータ • SalesForceやHubspotなど • Auditデータ • クラウドサービスの監査ログ、Tableau/Redashのログなど 扱っているデータの種類 14
Copyright © 2021 Classi Corp. All Rights Reserved. Classiのデータ組織の歴史
• 2018年6月AI室が誕生 • 4名の組織(エンジニア2人,データサイエンティスト2人) • 2018年7月データエンジニア入社 • データ基盤のプロトタイプの検討を開始 • Embulk + Digdagのデータパイプライン → BigQuery (第一世代) • 2018年11月 PJ Cockpitにより全社でBIを導入 • 2019年4月 データAI部が誕生 • https://www.wantedly.com/companies/classi/post_articles/141663 • 2019年5月 2人目のデータエンジニア入社 • Cloud Composer(Airflow)を利用したパイプラインへのアーキテクチャ変更 • 2020年1月 AWS Glueを利用したETL処理へ移行 • 2020年9月 データエンジニアが2名追加 • チーム開発体制へ • TerraformによるIaC化やCI/CD整備、スクラムライクな開発スタイルへ 15
Copyright © 2021 Classi Corp. All Rights Reserved. Classiのデータ活用戦略
• データを活用する目的 = Visionの達成のため 16 https://corp.classi.jp/company/message/
Copyright © 2021 Classi Corp. All Rights Reserved. Classiのデータ活用戦略
• 全社の目標にデータ活用が入っています 17
Copyright © 2021 Classi Corp. All Rights Reserved. Classiのデータ活用戦略
• 基本的にデータ民主化の戦略を取っています • Tableau/RedashなどのBIツールの利用と普及啓蒙 • データ基盤チームはDWH開発、DM開発サポートまでを責務に • 全社のデータ活用度合いをチームのKPIに 18
Copyright © 2021 Classi Corp. All Rights Reserved. アジェンダ •
会社概要 • データ組織の紹介 • データ組織のプラクティスの紹介 19
Copyright © 2021 Classi Corp. All Rights Reserved. • データ基盤の安定稼働のための品質向上の取り組み
• 収集するメトリクスの定義、SLO・SLIの定義と計測 • アラート・検知・対応のプラクティス化 データ基盤チームが今やっていること 20
Copyright © 2021 Classi Corp. All Rights Reserved. • 全社のデータ活用推進
• ツールごとに利用のダッシュボードを作成し、週次で確認 • 利用が落ち込んできた時には活性施策をうち、効果検証を実施 データ組織が今やっていること 21
Copyright © 2021 Classi Corp. All Rights Reserved. • SQL勉強会やダッシュボード勉強会の実施
• SQL勉強用のコンテンツ作成 データ組織が今やっていること 22 参考:SQL勉強会を通して痛感したデータ民主化への長い道のり https://tech.classi.jp/entry/2021/02/05/121144
Copyright © 2021 Classi Corp. All Rights Reserved. • 全社のデータ活用推進
• Uniposとキャラクターを活用したデータ活用促進声かけ データ組織が今やっていること 23
Copyright © 2021 Classi Corp. All Rights Reserved. • メタデータ環境整備と推進
• redashのダッシュボードを非データ系メンバーとハンズオン • 同時に内製のメタデータ管理ツール(Plato)にテーブル情報などを記載 データ組織が今やっていること 24
Copyright © 2021 Classi Corp. All Rights Reserved. • 様々な大学や研究機関との共同研究
データ組織が今やっていること 25
Copyright © 2021 Classi Corp. All Rights Reserved. • クラウドセキュリティへの取り組み
• Security Command Centerを利用した脆弱性検知や対応 データ組織が今やっていること 26 出典:https://cloud.google.com/blog/ja/topics/customers/classi-strengthen-security
Copyright © 2021 Classi Corp. All Rights Reserved. • より安定したデータ基盤の運用と品質向上
• dev/stg環境とテストの実施 • ストリームデータパイプラインの構築 • セキュアなデータパイプラインの構築 • より活用されるデータマートのためのDWH開発 • データ品質の向上 • データ基盤のリアーキテクチャ • ML SysとのML Pipeline接続 • 非構造化データを扱うパイプラインの検討 etc... データ基盤チームがこれからやっていきたいこと 27
Copyright © 2021 Classi Corp. All Rights Reserved. データエンジニアの採用の取り組み
• 基本的な採用プロセスを用いてチームで実施 • 採用媒体への募集要項の検討と掲載 • エージェント • スカウト/リファラル • 書類審査 • カジュアル面談 • 面接 • オファー • オンボーディング • 悩み • 採用むずい • 市場になかなかデータエンジニアがいない 28 https://hrmos.co/pages/classi/jobs/0000026 より
Copyright © 2021 Classi Corp. All Rights Reserved. データエンジニアの採用の取り組み
29 やりたいこと、やるべきことはいっぱいありますが、 完全にデータエンジニアの手が足りていません 😭 今日のこの発表を聞いて、教育業界のデータエンジニアリングに ご興味を持った方は、今すぐご応募ください!! _人人人人人人人人人人人人人人人人人人人_ > https://hrmos.co/pages/classi/jobs/0000026 <  ̄Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^ ̄
Copyright © 2021 Classi Corp. All Rights Reserved. おわり 30
ご静聴 ありがとうございました! 🙏🙏🙏