Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ぶんちん流データサイエンス教育のコンセプト
Search
ぶんちん
October 05, 2023
Education
0
210
ぶんちん流データサイエンス教育のコンセプト
ぶんちん
October 05, 2023
Tweet
Share
More Decks by ぶんちん
See All by ぶんちん
データ分析イベントデータ説明(VRChatイベントカレンダー)
bunnchinn3
0
65
<事前告知> DS集会データ分析イベント VRChatイベントカレンダー
bunnchinn3
0
59
統計知識と実務のギャップ
bunnchinn3
0
71
製造業における品質不良の要因分析04_ツール選択の考え方
bunnchinn3
0
70
これまでLT振り返り 何が人気の話題?
bunnchinn3
0
75
製造業における品質不良の要因分析03_必要な知識の入手方法
bunnchinn3
0
78
製造業における品質不良の要因分析02_分析着手順の考え方
bunnchinn3
0
78
製造業における品質不良の要因分析01_ゴール設定
bunnchinn3
0
120
良書紹介02_Head First データ解析
bunnchinn3
0
70
Other Decks in Education
See All in Education
Unraveling JavaScript Prototypes
debug_mode
0
160
The Task is not the End: The Role of Task Repetition and Sequencing In Language Teaching
uranoken
0
310
プログラミング基礎#4(名古屋造形大学)
yusk1450
PRO
0
130
2024年度秋学期 統計学 第12回 分布の平均を推測する - 区間推定 (2024. 12. 11)
akiraasano
PRO
0
130
HyRead2425
cbtlibrary
0
130
Policing the Poor
oripsolob
0
170
Image compression
hachama
0
410
あきた地域課題解決インターンMarch2025
toyodome
0
310
ハワイアン航空 ステータスへの道 #HAairstudy
maroon1st
0
110
地図を活用した関西シビックテック事例紹介
barsaka2
0
180
小学校プログラミング教育、次の5年に向けて 〜つくること・学ぶことの歓びへ〜 /NextGenerationOfProgrammingEducation
kiriem
2
390
Info Session MSc Computer Science & MSc Applied Informatics
signer
PRO
0
120
Featured
See All Featured
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
Code Review Best Practice
trishagee
67
18k
Done Done
chrislema
182
16k
Fireside Chat
paigeccino
35
3.2k
Art, The Web, and Tiny UX
lynnandtonic
298
20k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
27
1.6k
VelocityConf: Rendering Performance Case Studies
addyosmani
328
24k
Making Projects Easy
brettharned
116
6k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.2k
Product Roadmaps are Hard
iamctodd
PRO
51
11k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
134
33k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
13
1k
Transcript
ぶんちん流 データサイエンス教育 基本コンセプト ぶんちん 2023年10月5日 データサイエンティスト集会 in VRC 1 私の仕事紹介
自己紹介 ぶんちん 複合経営が特徴の企業(製造業)に所属 データ分析担当者だったが。。。 成果獲得を狙うと、 同じことに繰り返しで 飽きた 他者にやらせたら、
成果が増えるのでは 特に非専門家向けのDS教育 2
よくある社員向け教育の勘違い 専門的な講習・教育を受けさせた! 高度な技術習得で即戦力! 組織として将来安泰! 3 現実はそんなに甘くない エライ人
外部組織
従来型教育の課題 4 基礎統計? データサイエンス? 外部講師 だから何なの? 役に立たない 業務内容と 合わない 使い道が
わからない 大きなコストをかけたにも関わらず、ほとんど成果につながらない 適用できる 綺麗なデータがない
教育コンセプトの見直し 5 技術知識 規模重視 実務能力 歩留重視 技術知識 規模重視 実務能力 歩留重視
• 講習会形式で学ぶ • 知識面の”技術”指導が中心 • 教育の達成目標が抽象的 従来:初級者向け研修 新規案:実務研修 • 自身の業務課題をOJT形式で取り組む • 業務面の”技能”指導が中心 • 基本的な業務遂行が可能で、不足する技術 は自身で学習したり専門家と連携できると いった実務能力(が身についた自信)の獲 得を目標 対象者:別分野の専門家
指導カリキュラム <前半> メインコンテンツ 重要! データ分析ツールによるGUIによるデータ可視化 コーディングによるデータも網羅的な可視化 これまで使えてこれなかったデータの特徴量化
追加した特徴量を合わせた網羅的なデータの探索 業務適用 <後半> おまけ 機械学習の基本的な知識に関する講習 機械学習モデルの作成・評価体験 実課題に対して機械学習を適用検討 6 小規模でも確実な成果 機械学習 安直な認識を叩き潰す
基本的な手法 • そこそこの性能 • 使いやすい 少し高度な手法 • 性能向上 • デメリット追加
高度な手法 • さらに性能向上 • さらなるデメリット データサイエンス技術適用の構造 7 高度な手法は基本的な手法の 単純な上位互換ではない! 課題 技術的に高度になるほど扱いづらくなっていく →案件ごとに全体最適のバランス調整が重要 座学だけでの指導は無理
実課題を使った高速課題解決ループ 残課題の 具体化 対応指導 課題対応 8 品質不良の要因分析系テーマ 1. 楽にデータ可視化したい →データ分析ツールの使い方指導
2. 一気にデータを可視化したい →簡単なコーディング 3. 大量のデータを見切れない →見るデータの優先度の決め方 ・・・ 予測モデルによる業務支援テーマ 1. 何をしたら良いかわからない →業務フローの整理 2. 何ができるかわからない →類似事例を表示しては? 3. 類似の定義は? →単純な方法から ・・・ 受講生自身の担当課題を使ったOJT教育 実際はもっと 細分化して実施 超絶基本的な段階から とにかく高速にまわす 重点的に強化
DS教育の評価 成果 受講者全員が自身の業務で活用可能な能力習得 不足する技術は自走して習得可能 課題 OJT教育しかないから規模の拡大が困難 習得能力が地味で、従来教育に受講生を取られがち 9