Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20231112_ChatGPTの活用によるデータサイエンス人材の育成
Search
NobuakiOshiro
PRO
November 12, 2023
Technology
5.1k
5
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20231112_ChatGPTの活用によるデータサイエンス人材の育成
https://jscs.jp/conf/sympo37/
NobuakiOshiro
PRO
November 12, 2023
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20260610_Fable5_初回会話スライド全10ページ(初日は揉めました)
doradora09
PRO
0
20
20260611_Fable5_2日目_実務設計編_全10ページ(床のり在庫議論)
doradora09
PRO
0
21
20260612_Fable5_第3弾_方法論OS編_全10ページ(AI時代の戦略)
doradora09
PRO
0
21
20260610_中東情勢_物流資源ショック_統合分析19枚_v3
doradora09
PRO
0
3
20260604_福岡女子大_講義後小レポート分析スライド_NOBDATA
doradora09
PRO
0
20
20260601_中東情勢1週間差分update
doradora09
PRO
0
35
20260602_中東情勢と物流_3か月振り返り_10枚圧縮版_最新版
doradora09
PRO
0
40
伊藤さん_発表スライド_全業種x各国_20260602
doradora09
PRO
1
34
20260528_生成AIを専属DSに_Howの次にすべきことを考える
doradora09
PRO
0
290
Other Decks in Technology
See All in Technology
Chart.js が簡単に使えるようになっていたので OGP 画像生成に使った話
kamekyame
0
160
2026.06.13_AI時代に事業会社が「SIer出身エンジニア」を求める理由 / Why Businesses Seek Engineers with a System Integrator Background in the AI Era
jumtech
0
530
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.8k
もりもり新機能を一挙紹介! AgentCoreに入門して、AWS上にAIエージェントを構築しよう
minorun365
PRO
6
830
Rubyで音を視る
ydah
1
100
地元にいないローカルオーガナイザーの立ち回り
uvb_76
1
500
LLMと共に進化するプロセスを目指して
ymatsuwitter
12
3.2k
Ruby::Boxでできること、Refinementsでできること
joker1007
3
390
ChatworkとBPaaS 異なる特性で学んだAI機能開発の ベストプラクティス
kubell_hr
2
2.8k
MIERUNE JCT 発表資料「宇宙から伊能忠敬ごっこ」
syuchimu
0
190
Agentic Web
dynamis
1
140
Rancherの紹介&Update情報(RancherJP Online Meetup #09)
yoshiyuki_kono
0
110
Featured
See All Featured
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
Google's AI Overviews - The New Search
badams
0
1k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
840
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.5k
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.2k
Building Flexible Design Systems
yeseniaperezcruz
330
40k
Music & Morning Musume
bryan
47
7.2k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
520
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
201
75k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
460
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
1.6k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
720
Transcript
ChatGPTの活⽤による データサイエンス⼈材の育成 2023/11/12 NOB DATA株式会社 代表取締役 ⼤城 信晃
Copyright © 2023 NOB DATA All Rights Reserved. 簡単なアンケート Q
: ChatGPTを使ったことがありますか? 0 : 初めて触る or ⽉に1-2回程度 1: 無料版を週1は 使ってる (ChatGPT-3.5) 2: 有料版を契約して 使ってる (ChatGPT-4)
Copyright © 2023 NOB DATA All Rights Reserved. 本⽇の流れ 以下、60分程度をデモを交えつつ実施予定です
(その後、質疑応答を20分ほど) • ⾃⼰紹介とChatGPT活⽤のモチベーション • ChatGPTの基礎振り返り • データサイエンスの教育や実務へのCahtGPT活⽤ • 個⼈的な未来予想
Copyright © 2023 NOB DATA All Rights Reserved. ⾃⼰紹介とChatGPT活⽤のモチベーション
Copyright © 2023 NOB DATA All Rights Reserved. ⾃⼰紹介 ⼤城信晃(twitter
@doradora09) NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会九州⽀部 ⽀部⻑ ・住まい 沖縄 -> 東京 -> 福岡 ・職歴 ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業 ・運営コミュニティ ・Tokyo.R(2010-2016) ・fukuoka.R、PyData.Fukuoka、 オモシロAIごった煮勉強会、ChatGPT部、 他2つ 2022/12/5からChatGPTは利⽤ (利⽤から11ヶ⽉くらい)
Copyright © 2023 NOB DATA All Rights Reserved. R⾔語コミュニティの運営(Tokyo.R, fukuoka.R)
Copyright © 2023 NOB DATA All Rights Reserved. 企業紹介 企業情報
• 社名 ︓NOB DATA株式会社 • 設⽴年⽉⽇ ︓2018年9⽉ • 代表取締役 ︓⼤城信晃 • 所在地 ︓〒812-0013 福岡市博多区博多駅東2-5-19 サンライフ 第3ビル 6F • 事業内容 ︓データ活⽤に関するコンサルティング、受託分析、⼈材育成、セミナー、執筆など • Webサイト : https://nobdata.co.jp/ ü リモート&副業を中⼼としたのべ30名程のメンバーにて、AI・データ分析プロジェクトの プロフェッショナル集団として⽇本企業のDXの推進⽀援を⾏っております ü 全国どこでも、ビッグデータやAI技術の恩恵に預かれる環境づくりを⽬指しています
Copyright © 2023 NOB DATA All Rights Reserved. DS協会の活動 九州⽀部
九州エリアにデータサイエンティストを 増やすべく活動中
Copyright © 2023 NOB DATA All Rights Reserved. 2023/6/14-16の3⽇間は幕張メッセの展⽰会に出展
Copyright © 2023 NOB DATA All Rights Reserved. 企業でのデータ分析が本業の私がなぜ この1年弱、ChatGPTをウォッチしているのか?
Copyright © 2023 NOB DATA All Rights Reserved. 2022/3/14の衝撃 (GPT-4登場と⾔語処理学会)
(1/2) https://twitter.com/anlpmeeting/status/1646717419153661953
Copyright © 2023 NOB DATA All Rights Reserved. 2022/3/14の衝撃 (GPT-4登場と⾔語処理学会)
(2/2) 研究者の先⽣⽅も 「何が起きているのかわからない」 という衝撃 ChatGPTに関する情報や活⽤⽅法について情報収集 ( 主にユーザーとして )
Copyright © 2023 NOB DATA All Rights Reserved. 参考:検索クエリ(ヤフー DS.INSIGHTより)
• 4/11が「chatgpt」「チャットgpt」検索数のピーク
Copyright © 2023 NOB DATA All Rights Reserved. 4/10のサムアルトマン来⽇が報じられたのが4/11 •
ただし、現時点では結局この提案は実現していない (⾮常に残念) 引⽤元 https://twitter.com/AkihisaShiozaki/status/1645320688746762242
Copyright © 2023 NOB DATA All Rights Reserved. 現時点での所感 •
思ったより、⽇本では普及していない • ⽇本語、英語の性能差 (プログラミング⾔語ユーザーは利⽤率⾼) • $20の壁 (GPT-4を触ったことがあるかどうか) • 直近数年はおそらく⼤丈夫だが、⿊船が来る可能性も • 知的労働分野 • ⾔語の壁や⽂化の壁はChatGPTである程度カバーできる可能性 ( ⾳声対話もここ1ヶ⽉で実装済み ) • ⼀⽅で、ユーザーとして教育やDXへの活⽤といった ポテンシャルは⼗分ある => ChatGPTを活⽤したDS教育と⾔う観点で本⽇はお話
Copyright © 2023 NOB DATA All Rights Reserved. ChatGPTの基礎振り返り
Copyright © 2023 NOB DATA All Rights Reserved. ChatGPTとは •
OpenAI社が開発した⼤規模⾔語モデル (LLM) と呼ばれるAI https://openai.com/blog/chatgpt • 無料版(GPT-3.5)と有料版(GPT-4)、あと APIがある • 2022年11⽉末にリリースされ、わずか 2ヶ⽉で1億ユーザーを獲得する今⼀番 ホットなサービス
Copyright © 2023 NOB DATA All Rights Reserved. 本家本元のOpenAI社のChatGPTをまず使うべし •
様々な企業から「xxGPT」という名称で類似サービスが出ていますが、 OpenAI社の公式ChatGPTをまず使うのが1番の近道です • 「ChatGPT」で検索すると以下の画⾯が出ます こちらが公式 (英語サイトのみ)
Copyright © 2023 NOB DATA All Rights Reserved. 公式サイトの画⾯ ⼊り⼝
Copyright © 2023 NOB DATA All Rights Reserved. ChatGPTの利⽤画⾯ (旧IF,
2023/11/7以前) • 初回はユーザー登録が必 要です(無料登録可能) • その後、ログインすると 以下のような画⾯が出ま す (私は有料版を使っている ので、GPT-3.5に加えて GPT-4も使える状態) • なお、こちらは旧IFの画 ⾯となります (順次update) ここに依頼事項(プロンプト)を⼊⼒して ChatGPTと対話する
Copyright © 2023 NOB DATA All Rights Reserved. 追記:ChatGPTの利⽤画⾯ (新IF,
2023/11/7以降順次) • ⽇本時間11/7のOpenAI 社のDevDay以降、UIが 変更となりました • ⼤きな変更点の1つとし てGPT-4のデフォルトの 機能に画像⽣成、検索、 分析の機能が統合されて います • なお本資料では旧IFを ベースとした解説となり ますのであらかじめご了 承ください 機能が統合された
Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:対話と難易度調整 •
まず、従来のチャットbotのように、基本的な対話が可能 (ChatGPTについて教えて下さい、など)
Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:対話と難易度調整 •
例えば「⼩学4年⽣にも分かるように」と指⽰することも可能 (難しい表現がなくなる)
Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:要約 •
記事の要約もできる • 例えば以下のNEWS (修正前は2400字程度) • 岸⽥⾸相「チャット GPT」アルトマンCEO と⾯会 学習へ悪影響 懸念の声もある中 萱 野⽒「”禁⽌ではなく 活⽤”模索が重要」 • https://news.yahoo. co.jp/articles/8a6df ecf0dfc9b46adf3732 b0c2034118760aee4
Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:要約 ChatGPTで要約を実施
Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:ロールプレイや創作 •
ロールプレイや創作も可能 • 例えばIT企業における⾯接官と新卒の学⽣のやりとりをロールプレイ ▪依頼事項 以下の設定でロールプレイして ください ▪設定 IT企業における⾯接官と新卒の 学⽣のやりとりをロールプレイ
Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:メンター・先輩社員の代わり •
ChatGPTを先輩社員としていろいろ相談する例 • ここではITエンジニアの先輩としての役割
Copyright © 2023 NOB DATA All Rights Reserved. 以下、応⽤的な使い⽅の参考
Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:プログラミング •
⾃然⾔語、だけでなくプログ ラミング⾔語にも対応 • FizzBuzz問題なども解ける (3の倍数だとfizz、5の倍数 だとbuzzで答える)
Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:データ分析や考察 •
データを渡して考察、 というのもすぐできる (ただし、計算はまだ苦⼿) • 例えば右は⼈⼝分布のデー タを与えて考察してもらっ た例 • 0歳から100歳以上まで、 1歳区切りのデータ データソース:https://www.stat.go.jp/data/jinsui/2021np/index.html
Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:データ分析や考察 データソース:https://www.stat.go.jp/data/jinsui/2021np/index.html
Copyright © 2023 NOB DATA All Rights Reserved. 他にも、アイディア次第で多くのことが依頼できる •
補助⾦申請の⽀援、業務⽇報の整理など、アイディア次第で様々なタスクが実施可能
Copyright © 2023 NOB DATA All Rights Reserved. 利⽤している感覚としては 「あたかも画⾯の向こうに⼈がいる」
かのような使⽤感
Copyright © 2023 NOB DATA All Rights Reserved. 結局、何がすごいのか •
インターネット -> 「記憶」の外部化 (キーワードさえあれば検索すればOK) • ChatGPT -> 「思考」の外部化 (ただし、問う⼒が重要) (使いこなせる⼈は) 思考タスクを10倍、20倍にするポテンシャルがある
Copyright © 2023 NOB DATA All Rights Reserved. ChatGPT活⽤上の注意点と対策
Copyright © 2023 NOB DATA All Rights Reserved. ChatGPT活⽤の注意点3つ 情報漏洩に気をつける
• ChatGPTの無料版は学習データに使われる可能性があるため、個⼈情報や秘密の情報などは投稿しないように 気を付けてください ChatGPTのウソに騙されない • ChatGPTは確率的に⽂章を作成しているため、たまに間違った回答もします(not 検索エンジン) • 結果を鵜呑みにするのではなく、批判的思考、またエビデンスを⾃分で探すなどの検証能⼒が重要になります 情報が古い事に留意する • ChatGPTは2022年1⽉(※1)までのデータを基に学習をしているため、それ以降のNEWSについては疎いです • ただし、後述するChatGPT-4のプラグインを使えば検索も可能となります (※1) . .2023/11/7現在のGPT-3.5。随時変わります。 なお11/7のupdatedでGPT-4は23年4⽉までの情報を保持している
Copyright © 2023 NOB DATA All Rights Reserved. ご参考:プライベートモードへの切り替え(1/2) •
ブラウザ版のChatGPTを使っていると、将来そのやりとりが学習されてしまう 可能性があります(情報漏洩のリスク) • プライベートモードへの切り替えで学習への利⽤を拒否することができます ここをOFFにすると プライベートモードになる
Copyright © 2023 NOB DATA All Rights Reserved. ご参考:プライベートモードへの切り替え(2/2) •
ブラウザ版のChatGPTを使っていると、将来そのやりとりが学習されてしまう 可能性があります(情報漏洩のリスク) • プライベートモードへの切り替えで学習への利⽤を拒否することができます 通常モード プライベート モード
Copyright © 2023 NOB DATA All Rights Reserved. ChatGPT Plusで広がる世界
Copyright © 2023 NOB DATA All Rights Reserved. 機能拡張 &
マルチモーダル化したChatGPT 無料版のChatGPTは対話のみですが、 有料版のChatGPT Plusは下記の機能を備えています( 詳細は割愛 ) 画像認識 / 画像⽣成 ⾳声認識 / ⾳声出⼒ (アプリ版) プラグイン 検索 コード実⾏ 11/6発表の 追加機能
Copyright © 2023 NOB DATA All Rights Reserved. プラグインで外部サービス連携 (データ分析&可視化)
・Noteableプラグイン、がかなり強⼒。プログラムを外部で実⾏可能 ・データ分析の依頼やモデル構築、データ可視化なども可能 => 次のパートではこの辺りを深掘り https://app.noteable.io/f/a48e1977-3e15-4754-bd46- ed65ec0227dc/Decision_Tree_Demo.ipynb
Copyright © 2023 NOB DATA All Rights Reserved. 10⽉に公開された画像解析機能もポテンシャル⼤ MSさんの論⽂p106
より機械翻訳 ⾃動⾞の保険レポー トの⾃動⽣成 参考:https://arxiv.org/abs/2309.17421
Copyright © 2023 NOB DATA All Rights Reserved. ⾳声対話機能 ・アプリ版(iOS,
Android) のChatGPT-4では⾳声⼊ ⼒・⾳声出⼒が可能です ・例えば、「私が話す内容 を英語に翻訳してくださ い」などが指⽰⼀つで実現 可能です ここをクリック テキストモード ⾳声モード
Copyright © 2023 NOB DATA All Rights Reserved. データサイエンスの教育や実務への ChatGPT活⽤
Copyright © 2023 NOB DATA All Rights Reserved. データ分析タスクを ChatGPTに解いてもらう①
(交通事故データの可視化)
Copyright © 2023 NOB DATA All Rights Reserved. 1. データの可視化
(1/4) • 交通事故の可視化の例 (Pythonのforeumライブラリを利⽤) https://note.com/chatgpt_nobdata/n/n2c0f526bd252
Copyright © 2023 NOB DATA All Rights Reserved. データ可視化を依頼 (2/4)
• データをURLから取得させる⽅法(Noteable & WebPilotプラグインを利⽤) ▪依頼事項 noteableプラグインを使って、福岡県の交通 事故のデータの可視化をお願いします。ライ ブラリはleafletを利⽤し、クラスター表⽰して ください。 ▪データセット https://ckan.open- governmentdata.org/dataset/572a4d15- 5f63-4c51-b717-73deb6d04aaa Noteableプラグインで ⾃動コーディング
Copyright © 2023 NOB DATA All Rights Reserved. データ可視化を依頼 (3/4)
• ChatGPT-4が試⾏錯誤しながらプログラミングを実⾏
Copyright © 2023 NOB DATA All Rights Reserved. データ可視化を依頼 (4/4)
• ⽇本語で依頼するだけでこのレベルの可視化はほぼ全⾃動で可能
Copyright © 2023 NOB DATA All Rights Reserved. データ分析タスクを ChatGPTに解いてもらう②
(タイタニック号の⽣存予測)
Copyright © 2023 NOB DATA All Rights Reserved. ChatGPTのデータサイエンス関連の知識の収集元 ChatGPTはWeb上の多くの
情報をもとに学習を⾏ってい ます 例えば、機械学習コンペで有 名なKaggleについてもその対 象となっています ChatGPTをメンターとして、 機械学習タスクの⼿順を例⽰ してもらうことも可能です
Copyright © 2023 NOB DATA All Rights Reserved. ChatGPTのコード実⾏環境2つ ChatGPT
Plusには 「Advanced Data Analytics」(旧Code Interpreter) というPython のプログラムを実⾏できる環 境があります (ただし、pip installは不可) また、Noteableプラグイン を使うと外部ライブラリの pip installやR⾔語の利⽤も 可能です
Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(1/n) Kaggleのタイタニックの問題
について知っているかと⾔う 質問はYES
Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(2/n) 実験として、本家本元のサイ
トからトレーニング⽤のデー タをダウンロード それをChatGPTにアップ ロードして⽣存予測モデルの 構築を依頼 https://www.kaggle.com/competitions/titanic/data
Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(3/n) 「予測モデルを構築」「精度
評価」「混同⾏列の表⽰」 「特徴量重要度の表⽰」など を⽇本語で依頼するだけで、 ⾃動コーディング
Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(4/n) 決定⽊モデルを可視化した場
合のイメージ ⼥性 or 男性 ⼥性の場合 男性の場合 年齢分岐 6.5歳以上 6.5歳以下 客室の等級 1, 2等客室 3等客室 373名⾮⽣存 72名⽣存 5名⾮⽣存 125名⽣存 444名⾮⽣存 268名⽣存 59名⾮⽣存 56名⽣存 7名⾮⽣存 15名⽣存 380名⾮⽣存 87名⽣存 64名⾮⽣存 181名⽣存
Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(5/n) 特徴量重要度を可視化
(モデルはランダムフォレスト)
Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(5/n) Noteableプラグインを使え
ばLightGBMやSHAPなどpip installが必要なライブラリも 利⽤可能
Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(6/n) 前述のウォーターフォールプ
ロットのOutputの読み⽅の 質問
Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(7/n) 考察の依頼
Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(8/n) 気になる特徴量に関して、
深掘りの議論を展開 また必要に応じて、その観点 でのEDAの依頼、データの可 視化・考察などを⼀緒にすす めることも可能
Copyright © 2023 NOB DATA All Rights Reserved. おまけ: データサイエンスプロジェクトの
ロールプレイ
Copyright © 2023 NOB DATA All Rights Reserved. プロジェクトを選択式でロールプレイ ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ
エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG) https://chat.openai.com/share/404328f7-5b24-489c- a258-b3842b90dfcb
Copyright © 2023 NOB DATA All Rights Reserved. プロジェクトを選択式でロールプレイ ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ
エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)
Copyright © 2023 NOB DATA All Rights Reserved. プロジェクトを選択式でロールプレイ ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ
エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)
Copyright © 2023 NOB DATA All Rights Reserved. プロジェクトを選択式でロールプレイ ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ
エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)
Copyright © 2023 NOB DATA All Rights Reserved. プロジェクトを選択式でロールプレイ ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ
エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)
Copyright © 2023 NOB DATA All Rights Reserved. プロジェクトを選択式でロールプレイ ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ
エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)
Copyright © 2023 NOB DATA All Rights Reserved. プロジェクトを選択式でロールプレイ ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ
エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG) https://chat.openai.com/share/404328f7-5b24-489c- a258-b3842b90dfcb
Copyright © 2023 NOB DATA All Rights Reserved. 応⽤:ここまでの流れを架空データを作ってデモ 「ここまでの結果をサマリしてください」とすることで、他のセッションに内容
を概要レベルで引き継ぐことが可能。その上で、データを⽤いたデモを依頼。 https://chat.openai.com/share/70a80347-7a3e-487f- 8f0b-b94d54255e3e
Copyright © 2023 NOB DATA All Rights Reserved. 補⾜:分析だけがデータサイエンティストの仕事ではない データが⼿元にあり、モデルを
作ったり可視化をするのは当然仕 事ですが、「ステークホルダーと の調整」「仮説の構築」「分析後 のアクションの提⽰」などが企業 で働くデータサイエンティストに は求められます ⼀番良いのは先輩社員に相談した り、コミュニティで⽣の現場の仕 事の話を聞くことですが、難しい 場合は書籍やChatGPTを⽤いた ロールプレイなどで想像の範囲を 広げてみるのも良いのではと思い ます。 https://www.amazon.co.jp/dp/4297117584
Copyright © 2023 NOB DATA All Rights Reserved. 補⾜:プロジェクトの⼀連の流れで不明な部分はChatGPTにも相談
Copyright © 2023 NOB DATA All Rights Reserved. ご紹介: ChatGPT部
(部活動)
Copyright © 2023 NOB DATA All Rights Reserved. ChatGPT部、と⾔う部活動 •
毎週⼟曜⽇の午前10-11時に有志によるオンライン勉強会 (160名程度、常連は20名) • 活動内容のレポートをnoteに記載 • うち、ChatGPTを活⽤して勉強をしている事例を2つご紹介 https://chatgptclub.connpass.com/ https://note.com/chatgpt_nobdata/
Copyright © 2023 NOB DATA All Rights Reserved. ⽇本経済⼤学の原⽥さん・Python学習 x
ChatGPT • ChatGPTにカリキュラムを作成させ、問題作成、採点をシリーズで実施 • ⾃⾝のPython学習にChatGPTを活⽤ ( ⾃分で指⽰して教材を作る時代がくるとは・・ ) https://note.com/chatgpt_nobdata/n/n63d730f93f44
Copyright © 2023 NOB DATA All Rights Reserved. ⽇本経済⼤学の原⽥さん・Python学習 x
ChatGPT • 問題作成しかり、採点しかり https://note.com/chatgpt_nobdata/n/ndd3567bacb5f https://note.com/chatgpt_nobdata/n/n9d6a1a1d5b20
Copyright © 2023 NOB DATA All Rights Reserved. 88歳のiOSエンジニア、トミ爺さん 私が知っている限り、国内では最⾼齢のChatGPTユーザー
& iOSアプリエンジニア (10作品リリース) ⼩泉勝志郎さん主催のシニアプログラミングネットワーク( https://senior-programming.net/ )に所属。 60歳を過ぎてからプログラミングを勉強 https://www.amazon.co.jp/s?i=stripbooks&rh=p_27%3A%E9%88%B4% E6%9C%A8%E5%AF%8C%E5%8F%B8&s=relevancerank&text=%E9%88 %B4%E6%9C%A8%E5%AF%8C%E5%8F%B8&ref=dp_byline_sr_book_1
Copyright © 2023 NOB DATA All Rights Reserved. 88歳のiOSエンジニア、トミ爺さん ChatGPTには「質問番号」を毎回つけて、記録。プログラミングのエラーなどを相談してアプリ開発。
10/25-27の幕張メッセで⾏われたAI・⼈⼯知能エキスポではビデオにてLT出演
Copyright © 2023 NOB DATA All Rights Reserved. 88歳のiOSエンジニア、トミ爺さん ChatGPTには「質問番号」を毎回つけて、記録。プログラミングのエラーなどを相談してアプリ開発。
10/25-27の幕張メッセで⾏われたAI・⼈⼯知能エキスポではビデオにてLT出演
Copyright © 2023 NOB DATA All Rights Reserved. ChatGPTを活⽤した教育に関しての所感 •
ChatGPT x 教育、はまだ試⾏錯誤が多い分野ですが、「プログラミング」や 「データ分析」とは⾮常に相性が良いように感じます。 ( ⼈間とコンピュータやデータの間をChatGPTが取り持ってくれる ) ( また、その場でコード実⾏することで検証が可能 ) • 私は普段は社会⼈向けにDXの⽂脈でデータサイエンスやChatGPTの使い⽅を レクチャーすることが多いのですが、それ以外にもChatGPT部の活動などを⾒ ると学⽣から88歳の⽅まで、年齢問わず幅広く扱えるツールだなという印象 を持っています • 少なくとも「聞く相⼿がいなくて⼿が⽌まる」と⾔う状況の回避には⼀役買っ てくれている気がします
Copyright © 2023 NOB DATA All Rights Reserved. 個⼈的な未来予想
Copyright © 2023 NOB DATA All Rights Reserved. ご注意 •
以下のパートは未来予想なので、かなりの不確実性を伴います • 後半のパネルディスカッションのネタとして、 ブレストも兼ねまして話半分(確度50%)くらいで聞いて頂けると幸いです
Copyright © 2023 NOB DATA All Rights Reserved. ChatGPTの性能向上 [ほぼ確実]
• 現在はChatGPT-4が最新モデルですが、今後GPT-5, 6, 7のようにある程度ま ではさらなる性能向上が期待されています(少なくとも、2024年中は進化) • ⼀度に扱えるデータ量も11/6のDevDayの発表でGPT-4の32kトークンから128k トークン(約6.4万⽂字)まで拡張されました • 学習データの鮮度も2022年1⽉から2023年4⽉まで拡張 [確度中程度] • おそらく、学習や対策を重ねるにつれ、現在最⼤の問題であるハルシネー ション(幻覚症状)によるウソの出現確率も低減されるものと思われます [個⼈的な予想] • ⼀⽅で、テキストを中⼼としたWeb上で学習できるコンテンツの量は有限のた め、視覚情報や⾳声情報などのマルチモーダルでの学習、と⾔う⽅向性に進ん でいるように思われます • データ収集タスクの価値が上がる可能性があります(IoTやデータエンジニア等)
Copyright © 2023 NOB DATA All Rights Reserved. LLMの軽量化、ロボット接続、エッジ化 [ほぼ確実]
• ChatGPTのモデルは何度かチューニングや軽量化が⾏われている節があります (いわゆる、重要な部分だけを残した蒸留モデルでダウンサイジング) • また画像認識や⾳声認識の機能とロボットを組み合わせると、⾃⽴⾏動可能な ロボット型のエージェントがおそらく出てくるものと思われます (ゲームやバーチャル空間上ではすでにChatGPTを搭載した⾃⽴型のNPCキャ ラクターが登場) [確度中程度] • OpenAI社関係者⾃⾝も述べているように、いずれはネット接続なしの「ポータ ブルなモデル」が実⽤レベルに達する可能性が⾼いです(数年スパン) • 最近ではGPUだけでなく、CPUを4bit化することでローカル版LLMが⾼速に動作 する、というような話も聞こえてきます
Copyright © 2023 NOB DATA All Rights Reserved. 参考:ロボット視点を想定した画像からの判断 参考:https://arxiv.org/abs/2309.17421
• MSさんの論⽂の p199を機械翻訳 • 家庭⽤ロボットの 視点とした場合、 キッチンがどこに あるか?という問 いに答えている
Copyright © 2023 NOB DATA All Rights Reserved. 企業ではMSの躍進、⼀⽅でLLM開発には膨⼤なコスト •
ChatGPTの登場でどこが儲かったか?と⾔うと間違いなくマイクロソフトさん (OpenAI社に対して1兆円規模の投資を実施したと⾔われていますが、7-9⽉の売り 上げは13%増の8.5兆円、最終利益は27%増の3.4兆円) • ⼀⽅で、ChatGPTのようなLLMの開発には学習⽤の環境を整えるだけでも1000億円 以上かかる、と⾔われているほど⾼コストとなっています ( LLMの性能がスケール則に従う間は、いかに資⾦を投下できるかの勝負の側⾯も ) ( ⼩さなモデルでもファインチューニングを1回回すのに1000万かかる、となると個 ⼈レベルではどうしようもない・・ ) • 国内もLINEヤフー・ソフトバンク系列やNTT関係者などが国産LLMに着⼿していま すが、資⾦や計算リソースの観点ではMS・OpenAI連合には全く敵わないのでは、と 思っています。 (とはいえ、GPT-3.5レベルには近づいていると思います) (正⾯からぶつからない⽣き残り戦略も必要。個⼈的には⼈材育成・DX・半導体製造)
Copyright © 2023 NOB DATA All Rights Reserved. データサイエンティストはどうすべきか? •
トップを⽬指す:OpenAI社に誰か⾏って技術習得 (平均年俸1億円との噂) • ニッチ領域に特化:⽇本語ならでは、や特定のジャンルに特化 (ただし、⼈⼝半減に備える必要あり) • 守備範囲を広げる: 例えば狭義の予測モデルのチューニングのタスクから、前後のデータ整備やDevOps でのシステム実装。もっと範囲を広げるとプロジェクトのPMとして全体のマネジメ ント • DXをやる:アナログ->デジタルの部分などはまだまだ⼤量にタスクがあります (どちらかというとクラウドエンジニア、インフラエンジニア、BIアナリストが必要) • 他の領域に⾏く:3次産業->2次産業->1次産業。 ChatGPTの影響が少ない分野を探す
Copyright © 2023 NOB DATA All Rights Reserved. ビジネス界への影響 :
ゴールドマンサックスの予想 • 3億⼈の仕事をAIが奪い、 世界のGDPを7%程度引き 上げるという予測 • 2019年の世界のGDPが86 兆ドル程度なので、7%と すると6兆ドル(=800兆円 規模)のインパクト 引⽤元 : https://gigazine.net/news/20230330-generative-ai-risk/
Copyright © 2023 NOB DATA All Rights Reserved. 学⽣さんに向けて •
ChatGPTはある種の「家庭教師」「メンター」としての使い⽅が可能です • 「何を⽬指したいか」がある程度明確であれば、そのステップの登り⽅ChatGPTに 相談して先に進むことができます(ワクワクするテーマ・分野が⾒つかるとベスト) • 1社終⾝雇⽤の時代もすでに変わっていますので、まずは1分野である程度の実績 を積んだのち、シナジーの効く業界にピボットする、というフットワークの軽さが あっても良いと思います • 変化の激しい時代ですが、テクノロジー的には⾯⽩い時代だと思います。 ⼀緒に頑張っていきましょう。
Copyright © 2023 NOB DATA All Rights Reserved. 本⽇の流れ 以下、60分程度をデモを交えつつ実施予定です
(その後、質疑応答を20分ほど) • ⾃⼰紹介とChatGPT活⽤のモチベーション • ChatGPTの基礎振り返り • データサイエンスの教育や実務へのCahtGPT活⽤ • 個⼈的な未来予想
Copyright © 2023 NOB DATA All Rights Reserved. 質疑応答
Copyright © 2023 NOB DATA All Rights Reserved. ご清聴、ありがとうございました・・! 何か個別のご相談やご質問がございましたら
[email protected]
(NOB DATA問い合わせ窓⼝) までお気軽にどうぞ。