Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データサイエンス業務 最初の一歩
Search
ぶんちん
July 27, 2023
Technology
0
170
データサイエンス業務 最初の一歩
初心者向けに仕事で成果につなげられるようにするためには、どのようにプロジェクトを始めたらよいか紹介
ぶんちん
July 27, 2023
Tweet
Share
More Decks by ぶんちん
See All by ぶんちん
製造業における品質不良の要因分析04_ツール選択の考え方
bunnchinn3
0
17
これまでLT振り返り 何が人気の話題?
bunnchinn3
0
43
製造業における品質不良の要因分析03_必要な知識の入手方法
bunnchinn3
0
42
製造業における品質不良の要因分析02_分析着手順の考え方
bunnchinn3
0
41
製造業における品質不良の要因分析01_ゴール設定
bunnchinn3
0
73
良書紹介02_Head First データ解析
bunnchinn3
0
34
良書紹介01_生命科学・生物工学のための間違いから学ぶ実践統計解析
bunnchinn3
0
51
OJT指導のはじめかた
bunnchinn3
0
140
自律機械知能の行動観察
bunnchinn3
0
110
Other Decks in Technology
See All in Technology
TypeScriptの次なる大進化なるか!? 条件型を返り値とする関数の型推論
uhyo
2
1.7k
Exadata Database Service on Dedicated Infrastructure(ExaDB-D) UI スクリーン・キャプチャ集
oracle4engineer
PRO
2
3.2k
Introduction to Works of ML Engineer in LY Corporation
lycorp_recruit_jp
0
140
【令和最新版】AWS Direct Connectと愉快なGWたちのおさらい
minorun365
PRO
5
770
これまでの計測・開発・デプロイ方法全部見せます! / Findy ISUCON 2024-11-14
tohutohu
3
370
100 名超が参加した日経グループ横断の競技型 AWS 学習イベント「Nikkei Group AWS GameDay」の紹介/mediajaws202411
nikkei_engineer_recruiting
1
170
アジャイルでの品質の進化 Agile in Motion vol.1/20241118 Hiroyuki Sato
shift_evolve
0
180
LINEヤフーにおけるPrerender技術の導入とその効果
narirou
1
140
インフラとバックエンドとフロントエンドをくまなく調べて遅いアプリを早くした件
tubone24
1
430
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
0
110
Security-JAWS【第35回】勉強会クラウドにおけるマルウェアやコンテンツ改ざんへの対策
4su_para
0
190
【Startup CTO of the Year 2024 / Audience Award】アセンド取締役CTO 丹羽健
niwatakeru
0
1.4k
Featured
See All Featured
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
329
21k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
16
2.1k
Side Projects
sachag
452
42k
The Art of Programming - Codeland 2020
erikaheidi
52
13k
Fireside Chat
paigeccino
34
3k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
720
Building Flexible Design Systems
yeseniaperezcruz
327
38k
A Modern Web Designer's Workflow
chriscoyier
693
190k
The World Runs on Bad Software
bkeepers
PRO
65
11k
Making the Leap to Tech Lead
cromwellryan
133
8.9k
VelocityConf: Rendering Performance Case Studies
addyosmani
325
24k
Transcript
超初心者向け データサイエンス業務 最初の一歩! ぶんちん 2023年7月27日 データサイエンティスト集会 in VRC 1
自己紹介 ぶんちん 複合経営が特徴の企業(製造業)に所属 データ分析担当者だったが。。。 成果獲得を狙うと、 同じことに繰り返しで 飽きた 他者にやらせたら、
成果が増えるのでは 特に非専門家向けのDS教育 2
注意!! 基本的に高度な技術の導入に体制が整い切れていない組織 新規技術の開発ではなく、具体的な経済効果の獲得が私の主目的 多くの案件を根拠にしているものの、あくまで私の経験則 3 泥臭い The
重厚長大 製造業 私はスマートな業界ではなく、 が前提のお話です。
初心者が直面する壁 4 将来のためにデータサイエンスの勉強するぞ! 数学!機械学習!プログラミング!etc 勉強したことが仕事で使えない。 使ってみたけど成果につながらない。 実力不足。もっと勉強しないと! Q.いつになったら 仕事に生かせるの?? 成果を出せるの??
A.不足しているのは技術ではなく、 仕事の進め方(技能)かも?
よくある勘違い 高度な技術は基本的な技術の上位互換! それを活用した仕事ができるようになる! 技術を学べばすぐに実績を積める! 5 現実はそんなに甘くない
基本的な手法 • そこそこの性能 • 使いやすい 少し高度な手法 • 性能向上 • デメリット追加
高度な手法 • さらに性能向上 • さらなるデメリット データサイエンス技術適用の構造 6 高度な手法は基本的な手法の 単純な上位互換ではない! 課題 技術的に高度になるほど扱いづらくなっていく →案件ごとに全体最適のバランス調整が重要 いきなり使いこなせますか?
高度な技術の適用から考えてしまうと。。。 7 オーバースペックになっていない? など どのようなリスクが考えられる? どうやって運用していくの? 現場適用どうするの? モデルの監視はどうするの? 体制は?他部署との調整は? 誤動作した場合の対応ってどうなの?
いくらの効果と費用になるの? たとえ良い結果が得られた場合であっても… 全て解決しないと効果獲得まで至らない 様々な課題の整理・対応も併せて少なくないリソースが必要 →中断判断も難しく、泥沼案件化することが多い
世の中は失敗だらけ 私が考えている失敗の理由 ① 課題設定の失敗 ② 技術課題以外の問題 ➢ 理想論に基づいた目標設定 ➢ 実現不可能な課題の泥沼化
➢ 適用先の業務設計が不十分 8 “POC死”と検索すると、 死屍累々なのがよくわかります 数年前にPoC(Proof of Consept;概念実証)が流行 専門家と協力してAI(≒データサイエンス)を活用したプロジェクトが乱立 そのほとんどが失敗。9割が失敗といわれているが、もっと多いのでは? PoCが黒歴史的ワードに。
ポイント1:適切な課題設定 9 技術(シーズ)から課題を探すな!! 詳細は別の機会に説明します 課題解決ではなく、技術適用が目的になる →成果につながりにくい 私の初心者におすすめの取り組み課題 • 具体的に困っている人がいる •
ちょっとした改善活動
★ポイント2:基本的な手法で具体化 理由 技術課題とは別の部分の課題を明確にしたい 必要とされる”最低スペック”を検討できるよう、比較基準を最速で作りたい 見込みがなければ即撤退できるよう、投入リソースを最小限にしたい 10 手順
1. データの可視化(+α)程度でできる施策を検討 100点中20~50点の成果を最速で実現。定量評価を可能にする 2. 上記のアプローチが原理的に可能か、トライアルを実施。 技術面以外も含む課題を洗い出す。 ここまでできてから、徐々に手法を高度化していきましょう
まとめ 高度な手法を身に着けるだけでは成果につなげられない 適切な課題設定と技術課題以外の対応が超重要 特に初心者は、意図的に簡単な手法から順に検討を進めよう 11 とにかく •
技術課題の明確化 • 技術面以外の課題への対応 そこからスタートです。