Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LT_ChatGPTxRxGoogleColab_ペンギンデータを使って分析・モデリン...
Search
NobuakiOshiro
PRO
May 27, 2023
Science
790
3
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LT_ChatGPTxRxGoogleColab_ペンギンデータを使って分析・モデリングを学ぶ
https://fukuoka-r.connpass.com/event/281245/
NobuakiOshiro
PRO
May 27, 2023
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20260617_生成AIを専属DSに_バイブコーディングで簡易自動化ツール構築_ハンズオン_交通事故データ
doradora09
PRO
0
78
20260610_Fable5_初回会話スライド全10ページ(初日は揉めました)
doradora09
PRO
0
37
20260611_Fable5_2日目_実務設計編_全10ページ(床のり在庫議論)
doradora09
PRO
0
40
20260612_Fable5_第3弾_方法論OS編_全10ページ(AI時代の戦略)
doradora09
PRO
0
43
20260610_中東情勢_物流資源ショック_統合分析19枚_v3
doradora09
PRO
0
23
20260604_福岡女子大_講義後小レポート分析スライド_NOBDATA
doradora09
PRO
0
25
20260601_中東情勢1週間差分update
doradora09
PRO
0
37
20260602_中東情勢と物流_3か月振り返り_10枚圧縮版_最新版
doradora09
PRO
0
44
伊藤さん_発表スライド_全業種x各国_20260602
doradora09
PRO
1
39
Other Decks in Science
See All in Science
SHINOMIYA Nariyoshi
genomethica
0
150
生成AIの現状と展望
tagtag
PRO
0
130
データベース02: データベースの概念
trycycle
PRO
2
1.2k
生成AIと司法書士の未来.pdf
tagtag
PRO
0
130
Physical AIを支えるWeights & Biases
olachinkei
1
370
(CVPR2026) Back to Basics: Let Denoising Generative Models Denoise
shumpei777
0
140
Tensor Factorization Meets Deformed Information Geometry: Convex Relaxation under Deformed Algebra
gkazunii
0
110
Amusing Abliteration
ianozsvald
1
200
データベース10: 拡張実体関連モデル
trycycle
PRO
0
1.1k
東北地方における過去20年間の降水量の変化
naokimuroki
1
250
機械学習 - ニューラルネットワーク入門
trycycle
PRO
0
1k
データベース08: 実体関連モデルとは?
trycycle
PRO
0
1.2k
Featured
See All Featured
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
2
390
Building Flexible Design Systems
yeseniaperezcruz
330
40k
GitHub's CSS Performance
jonrohan
1033
470k
Why Our Code Smells
bkeepers
PRO
340
58k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
720
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
200
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.8k
Darren the Foodie - Storyboard
khoart
PRO
3
3.4k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
The Cost Of JavaScript in 2023
addyosmani
55
10k
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
730
Paper Plane
katiecoart
PRO
1
51k
Transcript
LT : ChatGPT x R x Google Colab ペンギンデータを使って 分析・モデリングを学ぶ
2023/05/27 @doradora09
⾃⼰紹介 ⼤城信晃(@doradora09) NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会 九州⽀部 委員⻑ ・住まい
沖縄 -> 東京 -> 福岡 ・職歴 ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業 ・運営コミュニティ ・過去 ・Tokyo.R(2010-2016) ・現在 ・fukuoka.R、PyData.Fukuoka、 意思決定のためのデータ分析勉強会、 オモシロAIごった煮勉強会、ChatGPT部 fukuoka.R運営メンバー。 最近2ヶ⽉はChatGPTばかり触ってます
サテライト観戦での勉強会も企画中 (主に今はTokyo.Rをサテライト観戦) https://satellite-study.connpass.com/
ChatGPT & 本⽇のLTについて • 世間を騒がしているOpenAI社の⼤規 模⾔語モデル • プログラミングもできるので、今回は データ分析初⼼者を想定してChatGPT に分析の⽅法を教えてもらって⾃習で
きるようになるのがゴール • 環境も揃えたいので、Google Colabで Rを実⾏ • 今回は有料版のGPT-4で動かしてます https://chat.openai.com/?model=gpt-4 ChatGPT
本⽇のデータセット • Palmerpenguinsパッケージのデータ (通称ペンギンデータ) • 3種類のペンギンのデータセットです (アデリーペンギン、 ヒゲペンギン、ジェンツーペンギン) https://allisonhorst.github.io/palmerpenguins/
Google Colab で Rを実⾏ • Rの環境構築もばらつきがある のでGoogle Colabにて。 • 気がついたら標準でRに対応し
ていました。ランタイム->ラ ンタイムの変更でR⾔語指定が できます。 (しかしいつの間に・・今まで は⼀⼿間かかってた) • 分析環境が同じだとセミナー とかやりやすくなりますね
以下、ダイジェストにて
①ChatGPTにデータセットについて聞く Q : あなたはR⾔語の palmerpenguinsパッケージとデー タセットを知っていますか?
②ChatGPTに分析⼿順について聞く • Q : R⾔語初⼼者向けに、google colab上でR⾔語を動かし、 palmerpenguinsのデモをしたい と思います。どのような分析をし たら良いか、表形式でアイディア をいただけますか?
②ChatGPTに分析⼿順について聞く • Q : R⾔語初⼼者向けに、google colab上でR⾔語を動かし、 palmerpenguinsのデモをしたい と思います。どのような分析をし たら良いか、表形式でアイディア をいただけますか?
③必要パッケージの導⼊ • Q : 2-4のコードをお願いします。 • ChatGPTにコードの例を出⼒ してもらい、Google Colabで 実⾏して動作確認
• 全体のコードは割愛
③必要パッケージの導⼊ & データ確認 • Q : 2-4のコードをお願いします。 • ChatGPTにコードの例を出⼒ してもらい、Google
Colabで 実⾏して動作確認 • 全体のコードは割愛 Google Colab
④可視化サンプル • Q :ステップ5のサンプルコード をいくつかのパターンでお願いし ます。 • ChatGPTにコードの例を出⼒ してもらい、Google Colabで
実⾏して動作確認 • 全体のコードは割愛
④可視化サンプル • Q :ステップ5のサンプルコード をいくつかのパターンでお願いし ます。 • ChatGPTにコードの例を出⼒ してもらい、Google Colabで
実⾏して動作確認 • 全体のコードは割愛
⑤予測モデルの学習フェーズ • Q : 6-9のステップをお願いしま す。 • モデリング以降も実施 • エラーが出たら修正依頼
• 全体のコードは割愛
補⾜:エラーが出た場合は修正依頼 • Q : Error in eval(family$initialize): y values must
be 0 <= y <= 1 Traceback: • モデリング以降も実施 • エラーが出たら修正依頼 (エラー⽂⾔をそのまま投げれば GPT-4は結構汲み取ってくれます) • 全体のコードは割愛
補⾜:エラーが出た場合は修正依頼 • Q : こちらの変更を加えた、モデリン グパート以降のソースコードを再 度表⽰してください。 • モデリング以降も実施 •
エラーが出たら修正依頼 (エラー⽂⾔をそのまま投げれば GPT-4は結構汲み取ってくれます) • ここから再開して、という指定も 可能 • 全体のコードは割愛
⑥予測モデルの実⾏と結果の評価 • Q :今回作成したモデルの性能評 価を⾏う⼿順を表形式でお願いし ます。 • 性能評価の⽅法確認 • 混同⾏列やROCカーブ
• 全体のコードは割愛
⑥予測モデルの実⾏と結果の評価 • Q :今回作成したモデルの性能評 価を⾏う⼿順を表形式でお願いし ます。 • 性能評価の⽅法確認 • 混同⾏列やROCカーブ
• でもペンギンデータってこんなに 予測性能でるんでしたっ け・・?? • 全体のコードは割愛 怪しい・・
補⾜2:outputの解説依頼 • Outputがテキストばっかりでどう解釈したら良いか分からな い、というときはそれを聞けば解説してくれます
さいごに • ChatGPT x R x Google Colabで楽々データ分析学習 • これから勉強したい!という⽅はChatGPT先⽣を味⽅にしてぜひデータ
分析の世界にもチャレンジされてみてはいかがでしょうか
Enjoy .. !!