Upgrade to Pro — share decks privately, control downloads, hide ads and more …

成功と失敗の実像と生成AI時代の展望

 成功と失敗の実像と生成AI時代の展望

Transcript

  1. プレゼンター 西岡 賢一郎 Data Informed CEO / D-stats CTO 2025年5月27日

    データサイエンスの現場における実践的知識と展望 成功と失敗の実像と 生成AI時代の展望 成功と失敗の実像と 生成AI時代の展望 データサイエンスの現場から学ぶ データサイエンスの現場から学ぶ
  2. 今日の主題 現場から学ぶデータサイエンスの本質 データサイエンスの成否は技術よ りも「人」と「組織」で決まる 最先端のAI技術よりも、組織文化やコミュニ ケーション、データの品質と目的の明確さが 成功要因となる 1 理論と現実のギャップを理解する 教科書の理想とビジネスの現場には大きな隔

    たり。華やかなAI技術よりも地道なデータ整 備と実用性の追求が価値を生む 2 生成AI時代のデータサイエンスの 新たな可能性 技術的障壁の低下により、非技術者でもデー タ活用の主役に。人間の強みを活かした新た な役割の重要性が増す 3
  3. 自己紹介 西岡 賢一郎 Data Informed CEO / D-stats CTO 学歴

    東京大学大学院総合文化研究科 博士(学術)取得 東京大学教養学部 学士課程修了 研究テーマ レコメンドシステムや位置データを用いた予測モデルの構築 キャリアパス データサイエンスとの出会い 大学時代にコンピューターサイエンスと出会い、実務における数学の応用に魅了される プログラミング学習 大学3年から独学でプログラミングを開始し、「仕組みの自動化」と「数値による説明」 に情熱を持つ 株式会社トライディア創業 博士課程在籍中に起業、シードアクセラレータープログラムに採用される データサイエンス企業売却 2018年に会社を売却し、データと意思決定の関係性の探求を続ける 現在の活動 日本とクアラルンプールの二拠点生活、マレーシアでのAIスタートアップ立ち上げを検討 中
  4. はじめに 本講演のテーマ データサイエンスの現場における 実践的知識と展望 講演日 2025年5月27日 講演者 西岡 賢一郎 対象

    明海大学データサイエンス講義受講者 " 今日の講演では、理論と実践のギャップに焦点を当て、現場で得た知見を共有 します。データサイエンスの本質は技術だけでなく、人と組織の相互作用にあ ることを、実際の事例を通じてお伝えします。
  5. なぜ今、この話が重要なのか 📊 データサイエンスの現実 のAIプロジェクトが期待通りの成果を出せていない(ガートナー調査, 2019) 技術習得だけでは現場で活躍できない 生成AI時代で求められるスキルが急激に変化 🎯 皆さんへの影響 就職活動での差別化要因

    入社後の即戦力として評価される知識 将来のキャリア設計に直結する洞察 💡 今日得られるもの 教科書では学べない「現場の真実」 失敗パターンの事前回避法 生成AI時代の新しいキャリア可能性 85%
  6. 研究から起業へ 博士課程 研究活動 プログラミングスキルを磨きながら研究の世界へ進む。レ コメンドシステムや位置データを用いた予測モデルの構築 に注力。 起業 株式会社トライディア創業 博士課程在籍中に株式会社トライディアを創業。データサ イエンスの知見をビジネスに活かす挑戦を開始。

    成長 アクセラレータープログラム シードアクセラレータープログラムに採用され、ビジネス モデルの洗練とスケーリングの機会を獲得。 2018 年 企業売却 データサイエンス企業として成長を遂げ、2018 年に会社を 売却。データと意思決定の関係性に魅了される経験が次の 挑戦へ。
  7. 現在の活動 Data Informed CEO 最新技術を活用したAI エージェント開発を主導。生成AI を活用したビジネ スソリューションの開発と実装。 D-stats CTO

    データサイエンスコンサルティングを提供。企業の意思決定プロセスをデ ータ駆動型へと変革し、効果的な戦略立案を支援。 機械学習の社会実装勉強会 主催者 毎月開催 最新のAI 技術と実践事例についての知見を共有する勉強会を主催。YouTube で勉強会の発表動画を公開中。 新規事業開発 AI スタートアップ 検討中 マレーシアの現地起業家と連携した新興市場向けAI ソリューションの開 発・提供を目指すスタートアップの立ち上げを検討中。まだアイデア段階 で具体的な計画は今後進行。
  8. データサイエンスの理想と現実 理想と現実のギャップを理解することが、実効性のあるデータサイエンスプロジェクトの第一歩 理想 高度な分析と予測 AI や機械学習を駆使した複雑なモデルによる精緻な予測と洞察 洗練されたアルゴリズム 最先端の技術を駆使したアルゴリズムによる意思決定の最適化 完全なデータ活用 企業内のデータが有効活用され、すべての意思決定がデータドリブン

    に 技術的ブレークスルー 技術的革新がビジネスの競争優位性に直結 現実 データ収集・クリーニングの優先 全体の60-70% の時間がデータの収集・クリーニングに費やされる 基本的な集計と可視化 実際には基本的な集計や可視化が大部分を占め、高度な分析は限定的 組織的・文化的障壁 技術的課題よりも、組織文化やコミュニケーションの問題が成否を左 右 データの断片性と品質問題 必要なデータが揃っておらず、目的達成に制約がある状況が一般的 VS
  9. 企業組織におけるデータサイエンスの課題 これらの組織的課題の解決なくして、技術的に優れたデータサイエンスプロジェクトも成功しない 意思決定プロセスの遅さ データに基づいた意思決定を行う際の承認プ ロセスの複雑さと合意形成の難しさ。 多くの 関係者を巻き込む必要があり、時間的コスト が高くなりがち。 データサイロ問題 部門ごとに別々のシステムでデータを管理

    し、組織横断的なデータ活用が困難に。 デー タの統合や一貫性の確保に大きな障壁が存在 する。 AI が目的化する本末転倒 「AI を使うこと」自体が目的化し、本来解決 すべき課題や創出すべき価値が見失われる現 象。 技術的な素晴らしさに目を奪われ、実用 性が二の次になる。 政治的事情によるAI 導入 予算や投資判断のためにAI を導入せざるを得 ない状況。 本当の課題解決よりも、組織内の 政治的なメリットが優先される問題。 データリテラシーの格差 経営層と現場のデータリテラシーの差によ り、分析結果の解釈や活用方法に齟齬が生じ る。 データサイエンティストと意思決定者の 間の翻訳者が不足。 既存システムとの統合難易度 レガシーシステムとの連携や統合が難しく、 データサイエンスの成果を 既存のビジネスプ ロセスにスムーズに組み込めない問題。
  10. 失敗事例から学ぶ教訓①:データ準備環境の軽視 データ準備環境構築の失敗事 例 ツール導入 ≠ 成功 問題点 クライアントが高額なAutoML ツールを導入したものの、殆ど活用されない状況に。 データを整備・管理する環境が未整備で、データ品質を確保するプロセスが存在しなかった。

    データ基盤やガバナンス構築より先にツール導入を急いだ結果、活用できる状態にならなかった。 結果 データはあっても「使える状態」にならず、高額投資が無駄に。 ツールからの出力結果に対する解釈能力も不足し、業務改善に活かせず。 AI プロジェクトへの社内の信頼を損なう結果となった。 教訓 高度なツール導入の前に、まずはデータ準備環境の整備と品質管理プロセスの確立が必須。 データ収集・整理・保存の仕組みがなければ、どんなツールも活きない。 データ環境整備から始め、段階的にツール導入へと進めることが重要。 データ準備環境なし 高額ツール導入 活用されず放置 成功例 ✅ 同様の課題に対し、まず体系的なデータ品質管理プロセスを確立し、その後段階的にツールを導入した企業で は、高価なツールと同等の成果を1/10 以下のコストで実現。
  11. 失敗事例から学ぶ教訓②:経営層とのコミュニケーションギャップ 情報過多による意思決定の停 滞 問題点 顧客セグメント分析において様々な切り口から大量のデータを探索的に分析。 分析の過程で生成された膨大な数字や図表を全て盛り込み、大量のスライドに。 長いプレゼンの割に情報量が多すぎて「結局何が言いたいのか分からない」という反応に。 根本原因 伝えたいことを絞りきれず情報過多になっていた。分析者は「包括的な情報提供」と考えていたが、 受け手からすると「焦点が定まっていない」と映っていた。

    「データの正確さ」を追求するあまり「相手に伝わるか」という視点が欠けていた。 結果 統計的には優れた分析結果が経営判断や施策に全く活用されず。 データチームの徒労感が蔓延し、モチベーション低下につながった。 「データは難しくて分からない」という組織的な認識が強化される悪循環に。 教訓 「全てを伝える」から「重要なことだけを伝える」への転換が必要。 1 ページのエグゼクティブサマリーから始め、詳細は要求に応じて提供する構造に。 プレゼンの目的は「分析結果を見せること」ではなく「意思決定を促すこと」であると認識する。 「結局何が言いたいのか分か らない... 」 成功例 ✅ 成功例:1 ページのエグゼクティブサマリーから始め、詳細は要求に応じて提供する構造にした結果、相手に伝 わるようになり、活発なディスカッションが生まれた。
  12. 失敗事例から学ぶ教訓③:複雑化の落とし穴 AI が目的化した購買予測モデ ル 状況 ウェブサイトでの購買予測モデル構築プロジェクト。 ほとんどのユーザーが非ログイン状態でサイトを利用している状態。 3rd Party Cookie

    の廃止により個人に紐づいた行動ログの取得が困難に。 問題点 会社の方針で「AI を使いたい」という、手段が目的化した状況。 データの断片性と紐付け不可能性という根本的制約を無視。 複雑なモデルを作ることに固執し、そもそもデータの質についての検証が不十分。 結果 モデル精度が低いだけでなく、予測できたとしても個々のユーザーに適用できず。 技術的に複雑なソリューションを構築したが実用価値ゼロという結果に。 多大な開発リソースと時間を浪費し、データチームへの信頼も低下。 教訓 「garbage in, garbage out 」の原則を肝に銘じること。 テクニカルな複雑さより「そもそもこのデータで何ができるのか」という基本的な問いを最優先に。 目的と手段を取り違えず、ビジネス価値を生む最も単純な解決策から検討する姿勢が重要。 Garbage In Garbage Out 非ログインユ ーザー Cookie 制限 断片化データ 成功例 ✅ 成功例:まず基本的なログイン促進施策から始め、段階的にデータを蓄積してからAI モデルを構築した企業で は、コンバージョンを向上させる施策を実現。
  13. 成功プロジェクトの共通点 データサイエンスプロジェクトの成功には、技術だけでなく組織・プロセス・コミュニケーションの要素が不可欠です。 現場での成功事例から見出された3 つの共通要素は以下の通りです。 明確な問題定義 何のために分析するのかが明確に定義さ れている KPI や成功指標が具体的に設定されている ビジネス価値との結びつきが明確化され

    ている 段階的アプローチ 小さな「勝利体験」の積み重ねによる信 頼構築 2 〜3 週の短いサイクルでの繰り返しによ る軌道修正 迅速なフィードバックと方向修正による 成功確率の向上 組織横断的な連携 データ専門家と現場担当者の協働による 実用性の確保 経営層のスポンサーシップと理解が推進 力になる 「データの民主化」による組織全体の参 画と文化醸成
  14. 効果的なデータコミュニケーション術 データの価値を最大化するためには、分析結果を適切に伝えるコミュニケーション技術が不可欠です。 以下の2 つの手法 は、データサイエンスの知見を実際のビジネス判断につなげるために役立ちます。 3 段階説明法 多くの業界で効果的なアプローチ。意思決定者が必要な情報を 素早く把握でき、判断までの時間を大幅に短縮できます。 結論から先に伝える

    30 秒で最重要ポイントを伝え、聞き手の関心を引きつける 1 簡易説明で概要を伝える 3 分程度で背景や分析手法の概要を簡潔に説明 2 詳細は必要に応じて提供 質問や関心に応じて詳細な分析結果や根拠を示す 3 データストーリーテリング 数字の羅列からストーリーへの転換。数値を具体的なビジネス インパクトと結びつけることで、行動につながる洞察を提供しま す。 悪い例 「非ログインユーザーのコンバージョン率は3.2% で、セグメントA では 4.7% 、セグメントB では... 」 良い例 「現在、サイト訪問者の70% が匿名です。 彼らの10% をログインユーザーに変えるだけで、 月間売上が800 万円増加します。 具体的には、お気に入り機能と購入履歴の活用で リピート率が25% 向上します。 」 ポイント: 単なる数値ではなく、 「だからどうなる?」という 意思決定 や行動につながる文脈で伝える
  15. 生成AI 時代のデータサイエンス 生成AI はデータサイエンスの実践方法に根本的な変化をもたらしています。 テクニカルな障壁が低下し、幅広いビジネスユーザ ーがデータ活用の恩恵を受けられるようになりつつあります。 根本的変化 データ前処理の大幅な自動化 従来最も時間を要していたデータ準備プロセスの自動化 効果は用途により異なりますが、多くの企業で50-80%

    の時間短縮を 実現 ※ただし、データの複雑さや業界によって効果は大きく異なります プログラミング障壁の低下 自然言語からコードを自動生成し、技術的知識なしでも 高度な分析 が可能に データ分析の「民主化」加速 専門知識がなくてもデータ分析が可能になり、 組織全体でのデータ 活用が促進される 具体的な変革例 データクリーニングの自動化 自然言語による指示だけで、欠損値処理や異常値検出が可能に 例 「このデータセットの欠損値を、カテゴリ変数は最頻値、数値変 数は中央値で埋めてください」 合成データ生成 プライバシーを守りながらリアルなデータを生成し、 テストやモデ ル開発に活用 コード生成による分析 プログラミングスキルがなくても、自然言語による指示で 複雑な分 析が可能に
  16. データサイエンティストの役割変化 生成AI 技術の進展により、データサイエンティストに求められる役割と価値は大きく変化しています 従来型のデータサイエンティスト コーディングとデータ処理のスペシャリスト 技術スキル を活かしたデータ加工・分析処理が主な業務。 日々の作業の大部分は プログラミング と

    データクリーニン グ 統計モデルの構築と検証 数理統計 の知識を活用した予測モデル・分類モデルの開発。 アルゴリズム選定 や ハイパーパラメータ調整 が重要な職務 データパイプラインの設計と実装 ETL/ELT プロセス の構築と運用保守。インフラ構築からデー タ品質管理まで テクニカルな側面 に注力 生成AI 時代の新しい役割 戦略的分析と意思決定の専門家 ビジネス価値創出 のための分析設計と実行が中心に。 プロン プトエンジニアリング を活用し複雑なデータ分析タスクを実 行 データ処理から洞察創出へのシフト 技術的作業から 価値発見 へと重点がシフト。 ストーリーテリ ング と インサイト抽出 に多くの時間を割くように 生成AI ツールの出力を検証・評価 批判的思考 によるAI 生成結果の品質保証と改善。 ハルシネー ション検出 や バイアス評価 などの専門的判断が不可欠 VS
  17. 生成AI 時代に求められるデータサイエンススキル 従来の技術スキルに加えて、これからのデータ活用人材に必要となる能力 AI 倫理とガバナンス 生成AI の公平性、透明性、責任ある使用を確 保するための能力。アルゴリズムバイアスや プライバシー問題を特定・緩和し、適切なAI 活用ガイドラインを実装する。

    必要なスキル 倫理的分析力:AI 利用の社会的影響評価 規制理解力:AI 関連法規制への対応 ステークホルダー調整:多様な価値観の調 和 キーワード 責任あるAI バイアス検出 透明性確保 生成AI の公平性・透明性を確保するための ガイドラインを策定し、モデルの社会的影 響を継続的に評価・調整する AI プロンプト設計スキル 生成AI に対して最適な指示を設計・実装する スキル。目的に合った質の高い出力を得るた めの「質問設計」の能力。プロンプトの構造 化や最適化を通じ、AI の性能を最大限に引き 出す。 必要なスキル 言語設計力:明確で構造化された指示の作 成 AI モデル理解:各モデルの特性と限界の把 握 検証能力:出力の品質評価と改善サイクル キーワード 指示設計 コンテキスト制御 出力最適化 AI の「思考」をガイドするための正確で効 果的なプロンプトを設計し、業務固有の課 題に合わせたAI 活用方法を構築する AI 活用・統合能力 AI ツールの特性を理解し、既存の分析手法と 効果的に組み合わせる能力。AI の限界を見極 めつつ、最適な分析アプローチを設計する総 合的なスキル。 必要なスキル 批判的思考力:AI 出力の検証と評価 問題分解能力:複雑な課題の構造化 創造的応用力:AI ツールの革新的活用 キーワード ハイブリッド分析 データ検証 価値創出 生成AI と従来のデータ分析手法を組み合わ せ、より効率的な意思決定支援や予測モデ ル構築を実現する これらのスキルが組織にもたらす変化 データ活用の民主化:テクニカルスキルがなくても データ分析の主役 にな れる環境の実現 組織横断的価値創出:部門間の データサイロ を越えた協働がより容易に 意思決定の迅速化:分析から実装までの サイクルタイム短縮 による競争優 位性の確立 継続的スキル進化:テクノロジー活用と 人間固有の強み を融合した新たな 専門性の確立 これらのスキルを習得することで、データを活用した 意思決定の質と速度 を大幅に向上させることが可能に
  18. 生成AI 時代の課題と対策(統合版) 生成AI 時代の課題と対策(統合版) 企業が直面する主要課題と効果的な対応戦略 生成AI 活用の成否は技術的課題より組織的・文化的要因に大きく左右される 品質保証の課題 精度のバラつきとハルシネーション 存在しない情報を自信をもって提示する現象。特に専門領域で顕著に発

    生 ブラックボックス性と説明責任 AI がなぜその回答を出したのか内部プロセスが不透明で検証が困難 日本企業特有の課題 日本語処理の精度と業界特有用語 業界特有の用語や文脈理解に課題。 近年のLLM で急速に改善中 組織文化とデータサイロ問題 部門横断的な連携の難しさとリスク回避的文化による導入障壁 バイアス・プライバシーリスク 意図しないバイアスの増幅 学習データに含まれるバイアスを増幅し、公平性や倫理的問題に発展 個人情報漏洩と機密データリスク 学習データからの個人情報流出や AI モデルの不正複製 による知的財産 リスク 対策の基本原則 人間による検証プロセスの確立 専門知識を持つ人間による 複数情報源での検証体制 段階的導入(PoC → パイロット → 本格運用) 段階的に適用範囲を拡大 し、リスクを管理 継続的モニタリングと改善サイクル 定期的な効果測定 とフィードバックの仕組み構築 組織全体での責任あるAI 利用文化の醸成 組織全体の理解と協力 による倫理的AI 活用
  19. 学生の皆さんが今すぐできること 段階的に取り組み、継続することが、データサイエンスキャリアにおける大きな差を生み出します 初級(今すぐ) 即日から始められる 難易度:低 Excel/Google スプレッドシートでの 基本分析 関数や簡単なグラフ作成から始める分析の一 歩

    数時間で習得 ChatGPT を使った簡単なデータ質問 AI に「この数値からどんな傾向が?」と質問 して分析の基礎を学ぶ 即日実践可能 身近なデータの整理と可視化 家計簿、バイト記録など身の回りのデータを 活用 楽しみながら 中級(3 ヶ月後) 3 ヶ月の学習後 難易度:中 Python 基礎 + Kaggle Learn プログラミングの基礎から実践的なデータ分 析手法まで 体系的学習 身近なデータでの可視化 Python (Matplotlib/Seaborn )で実データをグ ラフ化 スキル向上 大学の課題やサークル活動でのデー タ活用 学んだスキルを実際の活動に応用して価値を 生み出す 実践応用 上級(6 ヶ月後) 半年間の継続後 難易度:高 インターンでの実務経験 企業のリアルなデータ分析プロジェクトに参 加 キャリア構築 企業データ分析コンペ参加 Kaggle などのコンペで実力を試し、ポートフ ォリオに 差別化要因 卒論への分析手法の応用 学術研究にデータサイエンスの手法を取り入 れる 専門性向上
  20. データサイエンスキャリアへのアドバイス① 身につけるべきスキル ビジネス課題の翻 訳力 ビジネス問題をデータ分析 課題に適切に変換する能力 要件定義の質がプロジェ クト成否を左右 KPI と分析目標の明確化

    が必須 最も需要の高いスキ ル データリテラシー 基本的な統計概念の理解と グラフ解釈能力 相関と因果関係の区別が 重要 データの質と限界の理解 意思決定の基礎とな るスキル プロンプトエンジ ニアリング 生成AI に効果的な指示を出 すための技術 AI の特性と制約を理解 明確かつ構造化された指 示が鍵 急速に需要が高まる 新興スキル データストーリー テリング 分析結果を説得力のある物 語に変換する能力 聴衆に合わせた情報の最 適化 数値を行動可能な洞察に 変換 分析価値を最大化す るスキル 批判的思考力 AI の出力を適切に評価・検 証する能力 ハルシネーションの検出 と対処 バイアスと限界の認識 生成AI 時代に不可欠 なスキル 【重要な補足】 テクニカルスキルよりも「データを価値に変換する能力」が最も重要ですが、基礎的な技術理解は以下の理由で依然として重要です: ✓ AI の限界と可能性を正しく判断するため ✓ 技術チームとの効果的なコミュニケーションのため ✓ 品質保証と検証プロセスを適切に設計するため
  21. データサイエンスキャリアへのアドバイス② キャリアパス例 データサイエンスキャリア構築のステップ ビジネスアナリスト データを用いたビジネス意思決定の支援を行い、複雑なデータ から実用的な洞察を導き出す専門家 データ分析 ビジネス知識 可視化 問題解決

    アナリティクストランスレーター 技術チームとビジネスチームの橋渡し役として、ビジネス課題 をデータ分析課題に翻訳し、結果を事業価値に変換 コミュニケーション 要件定義 プロジェクト管理 データリテラシー データビジュアライゼーションスペシャリ スト 複雑なデータを効果的な可視化と直感的なダッシュボードに変 換し、意思決定を支援する専門家 データ可視化 ダッシュボード設計 UX デザイン 情報設計 AI プロンプトエンジニア 生成AI に対して最適な指示を設計・実装するスキルを持つ専門 家 プロンプト設計 AI モデル理解 出力評価 ユースケース分析 爆発的に需要が拡大中 ※新たな専門職として独立するか、既存職種のスキルセットとして統合さ れるかは、今後の市場動向による 1 基本的なデータリテラシーの習得 2 基礎的な技術概念の理解(統計、 機械学習の基本) 3 ビジネスドメイン知識の深化 4 生成AI ツールの活用スキル習得 5 プロンプトエンジニアリングの練 習
  22. 皆さんへのメッセージ データサイエンスの実践から学ぶ成功への道 「データで何ができるか」より「何をしたいのか」を明確にし、 一歩ずつ前進することが成功への近道です 皆さんの将来のご活躍を期待しています! 重要な気づき データサイエンスの成功は「技術 < 組 織・コミュニケーション」

    完璧な分析より「使える分析」を目指す 生成AI は脅威ではなく、人間の価値を高 める道具 差をつけるポイント ビジネス課題をデータ分析課題に「翻 訳」できる能力 分析結果を「ストーリー」として伝える 技術 生成AI を使いこなす「プロンプト力」 今日から始めよう 小さな分析プロジェクトで経験を積む 失敗を恐れず、学びを重視する姿勢 技術だけでなく「価値創出」を意識する