Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データサイエンス業務 最初の一歩

 データサイエンス業務 最初の一歩

初心者向けに仕事で成果につなげられるようにするためには、どのようにプロジェクトを始めたらよいか紹介

ぶんちん

July 27, 2023
Tweet

More Decks by ぶんちん

Other Decks in Technology

Transcript

  1. 基本的な手法 • そこそこの性能 • 使いやすい 少し高度な手法 • 性能向上 • デメリット追加

    高度な手法 • さらに性能向上 • さらなるデメリット データサイエンス技術適用の構造 6 高度な手法は基本的な手法の 単純な上位互換ではない! 課題 技術的に高度になるほど扱いづらくなっていく →案件ごとに全体最適のバランス調整が重要 いきなり使いこなせますか?
  2. 高度な技術の適用から考えてしまうと。。。 7 オーバースペックになっていない? など どのようなリスクが考えられる? どうやって運用していくの? 現場適用どうするの? モデルの監視はどうするの? 体制は?他部署との調整は? 誤動作した場合の対応ってどうなの?

    いくらの効果と費用になるの? たとえ良い結果が得られた場合であっても… 全て解決しないと効果獲得まで至らない 様々な課題の整理・対応も併せて少なくないリソースが必要 →中断判断も難しく、泥沼案件化することが多い
  3. 世の中は失敗だらけ 私が考えている失敗の理由 ① 課題設定の失敗 ② 技術課題以外の問題 ➢ 理想論に基づいた目標設定 ➢ 実現不可能な課題の泥沼化

    ➢ 適用先の業務設計が不十分 8 “POC死”と検索すると、 死屍累々なのがよくわかります 数年前にPoC(Proof of Consept;概念実証)が流行 専門家と協力してAI(≒データサイエンス)を活用したプロジェクトが乱立 そのほとんどが失敗。9割が失敗といわれているが、もっと多いのでは? PoCが黒歴史的ワードに。
  4. ★ポイント2:基本的な手法で具体化 理由  技術課題とは別の部分の課題を明確にしたい  必要とされる”最低スペック”を検討できるよう、比較基準を最速で作りたい  見込みがなければ即撤退できるよう、投入リソースを最小限にしたい 10 手順

    1. データの可視化(+α)程度でできる施策を検討 100点中20~50点の成果を最速で実現。定量評価を可能にする 2. 上記のアプローチが原理的に可能か、トライアルを実施。 技術面以外も含む課題を洗い出す。 ここまでできてから、徐々に手法を高度化していきましょう