Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
生成AIによる データサイエンスの進化 - バイブデータサイエンスがもたらす新しい未来
Search
Takaaki Yayoi
November 15, 2025
Technology
0
71
生成AIによる データサイエンスの進化 - バイブデータサイエンスがもたらす新しい未来
こちらの青山学院大学公開講座で説明した資料です。
https://www.aoyama.ac.jp/lecture_info/2025/event_20250416_03
Takaaki Yayoi
November 15, 2025
Tweet
Share
More Decks by Takaaki Yayoi
See All by Takaaki Yayoi
データとAIで未来を創るDatabricks - 君の可能性を加速させるプラットフォーム
taka_aki
0
100
Databricks Free Editionで始めるMLflow
taka_aki
0
910
初めてのDatabricks Apps開発
taka_aki
3
690
日本語で指示するだけ!AIで業務効率化を実現する 〜90分で体感する実践ワークショップ〜
taka_aki
0
1.7k
Apache Spark もくもく会
taka_aki
1
260
はじめてのDatabricks (2025年7月版)
taka_aki
0
170
生成AIによるデータサイエンスの変革
taka_aki
0
3.3k
生成AIによる情報システムへのインパクト
taka_aki
1
340
JEDAI Databricks Free Editionもくもく会
taka_aki
1
230
Other Decks in Technology
See All in Technology
Logik: A Free and Open-source FPGA Toolchain
omasanori
0
300
プログラミング言語を書く前に日本語を書く── AI 時代に求められる「言葉で考える」力/登壇資料(井田 献一朗)
hacobu
PRO
0
160
Flutterコントリビューションのススメ
d_r_1009
1
370
メタプログラミングRuby問題集の活用
willnet
2
790
マイクロリブート ~ACEマインドセットで実現するアジャイル~
sony
0
320
Datadog On-Call と Cloud SIEM で作る SOC 基盤
kuriyosh
0
170
Claude Code 10連ガチャ
uhyo
3
670
エンジニアにとってコードと並んで重要な「データ」のお話 - データが動くとコードが見える:関数型=データフロー入門
ismk
0
490
“それなりに”安全なWebアプリケーションの作り方
xryuseix
0
340
コンピューティングリソース何を使えばいいの?
tomokusaba
1
160
Post-AIコーディング時代のエンジニア生存戦略
shinoyu
0
270
CloudFormationコンソールから、実際に作られたリソースを辿れるようになろう!
amixedcolor
1
170
Featured
See All Featured
Art, The Web, and Tiny UX
lynnandtonic
303
21k
How GitHub (no longer) Works
holman
315
140k
GraphQLとの向き合い方2022年版
quramy
49
14k
Code Reviewing Like a Champion
maltzj
527
40k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
Why You Should Never Use an ORM
jnunemaker
PRO
60
9.6k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
8k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
24
1.6k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
118
20k
Designing for humans not robots
tammielis
254
26k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Automating Front-end Workflow
addyosmani
1371
200k
Transcript
©2025 Databricks Inc. — All rights reserved 生成AIによる データサイエンスの 進化
2025/11/15 Databricks Japan 弥生 隆明 1 バイブデータサイエンスがもたらす新しい未来
©2025 Databricks Inc. — All rights reserved 自己紹介 弥生 隆明
(やよい たかあき) Databricks シニア スペシャリスト ソリューションアーキテクト ▪ 2020年からデータブリックス ジャパンにお いて、プレセールス、POCに従事 ▪ 専門領域は生成AI、データエンジニアリン グ、Webアプリケーション ▪ 前職はコンサル、総合電機メーカー にてデータ分析・Webサービス構築 などに従事。インド赴任経験あり。 ▪ Qiitaでいろいろ書いています。 2 @taka_aki
©2025 Databricks Inc. — All rights reserved データ+AIカンパニー クリエーター 10,000+
グローバルのお客様 $2.4B+ 年間収益 4B+ の投資 レイクハウス の 発明者 生成AIの パイオニア LEADER 2025 Data Science & Machine Learning Analytic Stream Processing LEADER 2024 Data Science & Machine Learning
本日のアジェンダ( 90分) 第1部:導入と AIの基礎理解( 20分) AIとは何か、生成AIの仕組み 第2部:生成AI実践編(25分) ChatGPTとプロンプトエンジニアリング 第3部:生成AIがもたらすデータサイエンスの革命( 30分)
★ バイブデータサイエンスとは何か ★ 従来との違いと実践例 第4部:実践と今後の展望( 15分) 質疑応答 4
第1部 導入とAIの基礎理解 AIとは何か、なぜ今必要かを理解する 5
今日のキーワード 🔑 💬 プロンプト AIに出す「指示文」や「質問文」 例:「冷蔵庫の残り物でレシピを考えて」 🤖 生成AI 文章・画像などを新しく創り出すAI 従来のAI
= 識別、生成AI = 創造 ✨ プロンプトエンジニアリング AIから良い答えを引き出す技術 「具体的に」「役割を与える」がコツ 🎵 バイブデータサイエンス 自然な言葉でデータ分析する新時代 プログラミング不要で高度な分析が 可能に 6
AIはすでに身近にある 🌤 天気予報の精度向上 🏦 銀行の不正検知 🛒 Amazonのおすすめ機能 🚗 自動運転技術 7
従来のAIと生成AIの違い 従来のAI(識別・予測型) ✓ データを分類・予測 ✓ 例:画像認識、音声認識 生成AI(創造型) ✓ 新しいコンテンツを創り出す ✓
文章、画像、プログラム ✓ 人間との自然な対話 8
ChatGPTの登場で変わったこと 2022年11月リリース、5日で100万ユーザー 📝 文章生成・翻訳が自然に 💬 誰でも対話でAIを使える 💻 プログラミング支援 📊 データ分析とグラフ作成
9
生成AIの学習の仕組み ① インターネット上の膨大なテキストを学習 ② 言葉のパターンと関係性を理解 ③ 質問に対して最適な応答を予測生成 💡 トランスフォーマー技術で文脈理解 10
主要な生成 AIサービス 11
第2部 生成AI実践編 ChatGPTを使いこなすテクニック 12
日本における AI利用の現状( 2024-2025) 【統計データ(総務省情報通信白書)】 🤖 生成AI利用率 • 日本全体:26.7%(2024年) • 20代:44.7%
• 50代:19.9% • 60代:15.5% 💡 シニア世代の生成AI利用はこれから本格化 13 出典:総務省 情報通信白書 2025年版 https://www.nikkei.com/article/DGXZQOUA045CP 0U5A700C2000000/
自治体での AI活用事例 神奈川県横須賀市 おしゃべりAIアプリ「Cotomo」実証実験 ✓ 高齢者の認知症予防 ✓ AIとの対話で過去の記憶を呼び起こす ✓ 孤独感の軽減
愛媛県伊予市・西条市 AIケアプラン作成支援システム ✓ 高齢者の自立支援 ✓ ケアマネージャーの業務効率化 💡 公的機関も積極的にAI活用を推進 14
ChatGPTの基本操作 ① https://chatgpt.com/ にアクセス ② アカウント登録(無料) ③ 質問を入力 → 回答を確認
初めての質問例: 「あなたは何ができますか?」 15 これはプロンプトと呼ばれます! 💬 プロンプトとは? AIに出す「指示文」や「質問文」のこと です。つまり、あなたがAIに何をしてほし いかを伝える言葉です。
プロンプトエンジニアリング AIに「どう質問・指示を出すか」を設計する技術 のことです。 言い換えれば、AIとの「会話の設計」です。たとえば、同じAIでも質問の仕 方次第で答えの質が大きく変わります。これは、AIが 「言葉の文脈」を手がかりに考えるからです。 🧠 日常の例で言うと … AIは「とても優秀なアシスタント」ですが、漠然とした指示だと
こちらの意図を正確に理解できません。 16
プロンプトエンジニアリング 後者のように、目的・対象・形式・トーン を具体的に伝えると、 AIは最適なアウトプットを出せます。 これが「プロンプトエンジニアリング」です。 🖐5つのコツ 1. 具体的に 2. 背景情報(文脈)を提供
3. 出力形式を指定 4. 役割を与える 5. ステップバイステップで 17
プロンプト実例 「あなたは栄養士です。冷蔵庫の残り物で30分以内に作れる 栄養バランスの良い夕食を3つ提案してください。 各レシピには材料と手順を含めてください」 【ポイント】 ✓ 役割設定 ✓ 具体的な条件 ✓
出力形式の指定 18
💻 実践演習 各自5分程度、自由に質問してみましょう 【例】 • 腰痛を和らげるストレッチ • ガーデニングで育てやすい野菜 • 孫へのお祝いメッセージ
19
できること・できないこと ✅ できる • 文章作成、要約、翻訳 • データ分析 • プログラミング支援 ❌
注意 • リアルタイム情報 • 正確性の保証 • 個人情報の保護 • 専門的医療・法律相談 20
第3部 生成AIがもたらすデータサイエンスの革命 Vibe Data Science:対話でデータ分析する新時代 21
データサイエンスとは データサイエンスとは、膨大なデータの中から価値のある「気づき」や「答 え」を見つけ出すための考え方と技術 のことです。 簡単に言えば、データをもとにより良い判断をするための科学 です。 🔍 なぜ今、データサイエンスが大切なのか これまで私たちの判断は、「経験」や「勘」に頼ることが多くありました。しかし、 ビジネスや社会の変化が速くなる中で、データに基づいた客観的な判断
が 求められるようになっています。 データサイエンスは、こうした「勘と経験の世界」を「データに裏づけられた判 断」に変える力を持っています。 22
データサイエンスの課題 【専門性の壁】 • Python、R、SQLの習得必須 • 統計学の深い知識が必要 • データクリーニングに80%の時間 【ツールの複雑さ】 •
複数ツールの使い分け • コマンドライン操作 💡 結果:一部の専門家しか活用できない 23
バイブコーディング 「雰囲気」や「意図」を伝えるだけでコードを生成する開発スタイル プログラマーが厳密な仕様やアルゴリズムを定義するのではなく、 「こんな感じで動いてほしい 」という大まかな意図を自然言語で伝え、 AIが適切なコードを生成する開発手法。 24
バイブデータサイエンス 「ビジネスゴール」や「欲しい洞察」を伝えるだけで分析を実行するデータサイエンス データサイエンティストが統計手法や機械学習アルゴリズムを選択するので はなく、「この課題を解決したい 」「こんなインサイトが欲しい 」という要望を伝 え、AIが適切な分析を実行する手法。 25
生成AIによるパラダイムシフト コードを書く → 対話で指示する バイブデータサイエンスとは 💬 自然言語でデータ分析 🤖 AIが自動でコード生成・実行 🔄
対話で分析を深掘り 📊 専門知識なしで洞察を獲得 3つの革新 ① プログラミング不要 ② 思考に集中できる ③ 誰でもアナリストに 26
プロンプト例 【プロンプト例】 「定年後の生活で必要な準備項目を、 以下の表形式でまとめてください: | 分野 | 準備項目 | 時期
| 重要度 | 分野は「健康」「お金」「住まい」「趣味」 「人間関係」で分類してください。 重要度は★で5段階評価してください。」 27
具体例:電気使用量の分析 従来の方法 1. Excel整形(30分) 2. Pythonコード(90行) 3. グラフ作成(20行) バイブデータサイエンス 1.
ファイルアップロード 2. 「月ごとの推移をグラフにして、 季節変動を分析して」 💡 同じ結果、劇的に簡単! 28 → 合計2-3時間 → 数分で完了
バイブデータサイエンスの仕組み 👤 ユーザー ↓「先月の売上トップ5を棒グラフで」 🤖 生成AI ↓ ① 質問を理解 ↓
② コード生成 ↓ ③ 実行 ↓ ④ グラフ作成 ↓ ⑤ 結果を解説 📈 結果 ✓ グラフ表示 ✓ 「トップ5で全体の45%」 ✓ さらに深掘り可能 29
実践例① 家計データ分析 【準備】家計簿Excel(3ヶ月分) 【プロンプト】 このデータを分析して: 1. 月ごとの推移(折れ線グラフ) 2. カテゴリ別割合(円グラフ) 3.
節約ポイント3つ 【AIの出力】 ✓ グラフ2枚 ✓ 「食費35%、外食が多い」 ✓ 「外食週2回減で月1.5万円節約」 30 ⏱ 2-3分で完了
実践例② 健康データ相関分析 【データ】毎日の歩数、睡眠、血圧、気分 【プロンプト】 「歩数と気分の関係を散布図で。相関係数を計算し、推奨歩数を提案し て」 【結果】 ✓ 散布図で可視化 ✓
「相関係数0.72(強い正の相関)」 ✓ 「7,000歩以上で気分良好80%」 ✓ 「推奨:毎日7,000-8,000歩」 31
データサイエンス × 生成AI 【従来】専門家が数週間かけて分析 【今】誰でもリアルタイムで質問→即答 【活用例】 🏪 小売:「売上低下の理由を天候と併せて分析」 🏭 製造:「機械故障パターンを5年分から発見」
🏥 医療:「治療効果を比較分析」 32
データとAIの民主化 【これまで】データ分析 = 専門家だけ 【生成AI時代】 ✓ シニア層も活用 ✓ 中小企業も高度分析 ✓
学生も研究レベル ✓ 自治体も政策立案 【例】地方自治体職員がAIで: • 人口動態分析 • 予算最適化 • アンケート集計分析 33
生成AIだからできる新たなデータ分析 【マルチモーダル分析】テキスト+画像+数値を統合 【自然言語クエリ】SQL不要、日本語で質問 【説明可能なAI】「なぜ?」も答える 【高速仮説検証】「もし◦◦なら?」を即シミュレーション 34
Databricks Free Edition データサイエンスをより学びたい人は... 35 https://www.databricks.com/jp/learn/free-edition
注意点 ⚠ AIも完璧ではない • データの質で結果が変わる • 相関を因果と誤認:アイスクリームの売上と溺死者数は相関があるが、 因果関係はない(どちらも夏に増えるだけ) • バイアスの影響:AIは学習データに偏りがあると、偏った答えを出すことがある
✅ 人間の役割 1. 適切な質問 2. 結果の批判的検証 3. 最終判断 4. 倫理的配慮 💡 AIはツール、使うのは人間 36
データプライバシー 【リスク】 ⚠ 外部AIは学習に使用の可能性 【安全な活用】 ✓ 個人情報は匿名化 ✓ 有料版(学習なし設定可能なものあり)の検討 ✓
企業向けAI活用 【家庭での実践】 金額のみ、個人名削除 💡 便利さとプライバシーのバランス 37
データサイエンスの未来 【2025-2030】 🤖 完全自律アナリストAI 🔮 個人レベル予測精度向上 🌐 リアルタイム分析 【社会への影響】 •
個人データを資産管理 • データ駆動意思決定が標準 • 中小企業も大企業並み分析 💡 「誰もができるスキル」へ 38
バイブデータサイエンスのツール 【ChatGPT】 1. ファイルをアップロード 2. 自然言語で質問 3. AIがコードを自動生成・実行 4. グラフが表示される
5. 結果の解説が表示 【Google Colab + Gemini】 1. ノートブックで質問 2. Data Science Agentが分析方針を提案 3. 自動でコード生成・実行 4. 対話で分析を深掘り 💡 まるで専属アナリストと対話 39
実践例③ 趣味のデータ分析 【家庭菜園の収穫記録分析】 データ:1年間の野菜ごとの収穫量、気温、水やり頻度 【プロンプト】 「家庭菜園の収穫データを分析して: 1. 野菜別の収穫量推移グラフ 2. 気温と収穫量の関係
3. 来年の栽培計画への提案」 40
実践例④ 投資ポートフォリオ分析 【保有株式のデータ分析】 データ:保有銘柄、取得価格、現在価格、配当金 【プロンプト】 「投資ポートフォリオを分析して: 1. 業種別の分散状況(円グラフ) 2. 含み損益の可視化
3. リスク分散の評価と改善提案」 41
データクリーニングの自動化 【従来の課題】 データ分析の80%はクリーニング作業 • 欠損値の処理、異常値の検出、データ型の統一、重複データの削除 → 専門知識と時間が必要 【生成AIによる自動化】 「このCSVファイルをクリーニングして:欠損値を補完し、異常値を除外してください」 ✓
AIが自動で問題を検出 ✓ 適切な処理方法を選択 ✓ クリーニング済みデータを出力 💡 面倒な前処理から解放 42
第4部 実践と今後の展望 明日から使える AI活用法 43
明日から使えるシーン 【日常】 📝 買い物リスト最適化 🍳 冷蔵庫レシピ提案 ✈ 旅行計画 【健康】 💪
運動メニュー 🥗 栄養バランス確認 【趣味】 🌱 家庭菜園予測 📸 写真整理 🎨 アイデア出し 44 町内会の参加者データ分析 地域イベントの最適化 血圧と食事の関係分析 薬の服用記録と体調の可視化 俳句や短歌の添削 旅行の思い出アルバム作成
安全に使う 3つの注意点 ① 個人情報は入力しない ② 情報の真偽を確認 ③ 重要判断は専門家に相談 参考 •
著作権に注意 • パスワード定期変更 • 無料版と有料版を理解 • フィッシング詐欺に警戒 45
無料版 vs 有料版 【無料版(GPT-3.5)】月額:0円 ✓ 基本的な質問応答 ✓ 文章作成 【Plus(GPT-4)】月額:20ドル(約3,000円) ✓
高度な推論 ✓ 画像理解・生成 ✓ ネット検索 ✓ 速い応答 💡 まずは無料版から 46
AIの限界と倫理 【限界】 • 創造性は限定的 • 感情理解は表面的 • 責任は取れない • バイアス含む
【倫理課題】 🤖 雇用への影響 📝 著作権 🎯 プライバシー ⚖ 公平性 47 倫理課題
学習ロードマップ 1⃣ステップ1(1-2週間) ChatGPTに触れる ✓ アカウント作成 ✓ 簡単な質問から始める 2⃣ステップ2(1ヶ月) 日常で使ってみる ✓
レシピ、旅行計画 ✓ プロンプトのコツを学ぶ 48 3⃣ステップ3(2-3ヶ月) データ分析に挑戦 ✓ 家計簿、健康データ ✓ Excelファイルをアップロード 4⃣ステップ4(3ヶ月以降) 応用・深化 ✓ 趣味や仕事に活用 ✓ コミュニティに参加
AIと共存する社会 🤖AIに任せる • 単純作業 • データ分析 • パターン認識 👤人間が担う •
創造的発想 • 倫理判断 • 共感 • 最終意思決定 💡 AIは道具でありパートナー 49
本日のまとめ 🤖生成AIの可能性 • 誰でも使える対話型アシスタント • バイブデータサイエンスで分析革命 📈データサイエンスの進化 • プログラミング不要で高度分析 •
データの民主化が実現 📖これからの学び • まずは使ってみる • 安全に配慮 • 学び続ける 💡 AIは暮らしを豊かにする道具 50
Q & A ご質問をお受けします 【よくある質問】 Q: 本当に無料で使えますか? Q: スマホでも使えますか? Q:
個人情報が漏れませんか? Q: 間違った情報は? Q: 有料版の価値は? 51
©2025 Databricks Inc. — All rights reserved 52