Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LT_ChatGPTxRxGoogleColab_ペンギンデータを使って分析・モデリン...
Search
NobuakiOshiro
PRO
May 27, 2023
Science
3
730
LT_ChatGPTxRxGoogleColab_ペンギンデータを使って分析・モデリングを学ぶ
https://fukuoka-r.connpass.com/event/281245/
NobuakiOshiro
PRO
May 27, 2023
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20250726_DeepResearchで何かしらの情報を調べた後のTips
doradora09
PRO
1
45
20250718_分析業務への生成AI活用(テキストマイニングを例題に)
doradora09
PRO
1
78
20250715_AI時代到来・企業リスクへの生成AI活用術
doradora09
PRO
0
66
20250709_MacStudioとLlama-4Maverickでローカル画像認識
doradora09
PRO
1
48
20250709_第3回_GenAIアナリティクス勉強会at東京_オープニングトーク
doradora09
PRO
0
72
20250625_生成 AI 活用2年目の壁を突破せよ_(60min版)
doradora09
PRO
0
52
20250628_生成AIおすすめyoutube共有会_ChatGPT部第69回
doradora09
PRO
0
65
20250614_LT_走れメロスの個人情報マスク処理をMacStudio 512GBメモリマシンで試してみた
doradora09
PRO
1
12
20250607_AIから始めるロボット勉強会_HuggingFaceについて
doradora09
PRO
0
25
Other Decks in Science
See All in Science
データマイニング - ウェブとグラフ
trycycle
PRO
0
140
データマイニング - コミュニティ発見
trycycle
PRO
0
130
実力評価性能を考慮した弓道高校生全国大会の大会制度設計の提案 / (konakalab presentation at MSS 2025.03)
konakalab
2
190
Valuable Lessons Learned on Kaggle’s ARC AGI LLM Challenge (PyDataGlobal 2024)
ianozsvald
0
400
機械学習 - ニューラルネットワーク入門
trycycle
PRO
0
840
機械学習 - SVM
trycycle
PRO
1
870
Accelerated Computing for Climate forecast
inureyes
PRO
0
110
機械学習 - 決定木からはじめる機械学習
trycycle
PRO
0
1k
データベース11: 正規化(1/2) - 望ましくない関係スキーマ
trycycle
PRO
0
920
論文紹介 音源分離:SCNET SPARSE COMPRESSION NETWORK FOR MUSIC SOURCE SEPARATION
kenmatsu4
0
280
深層学習を用いた根菜類の個数カウントによる収量推定法の開発
kentaitakura
0
170
06_浅井雄一郎_株式会社浅井農園代表取締役社長_紹介資料.pdf
sip3ristex
0
580
Featured
See All Featured
A Modern Web Designer's Workflow
chriscoyier
695
190k
How to Ace a Technical Interview
jacobian
278
23k
A designer walks into a library…
pauljervisheath
207
24k
RailsConf 2023
tenderlove
30
1.2k
Typedesign – Prime Four
hannesfritz
42
2.7k
Building a Scalable Design System with Sketch
lauravandoore
462
33k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
8
750
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Stop Working from a Prison Cell
hatefulcrawdad
271
21k
Rebuilding a faster, lazier Slack
samanthasiow
83
9.1k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.8k
Transcript
LT : ChatGPT x R x Google Colab ペンギンデータを使って 分析・モデリングを学ぶ
2023/05/27 @doradora09
⾃⼰紹介 ⼤城信晃(@doradora09) NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会 九州⽀部 委員⻑ ・住まい
沖縄 -> 東京 -> 福岡 ・職歴 ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業 ・運営コミュニティ ・過去 ・Tokyo.R(2010-2016) ・現在 ・fukuoka.R、PyData.Fukuoka、 意思決定のためのデータ分析勉強会、 オモシロAIごった煮勉強会、ChatGPT部 fukuoka.R運営メンバー。 最近2ヶ⽉はChatGPTばかり触ってます
サテライト観戦での勉強会も企画中 (主に今はTokyo.Rをサテライト観戦) https://satellite-study.connpass.com/
ChatGPT & 本⽇のLTについて • 世間を騒がしているOpenAI社の⼤規 模⾔語モデル • プログラミングもできるので、今回は データ分析初⼼者を想定してChatGPT に分析の⽅法を教えてもらって⾃習で
きるようになるのがゴール • 環境も揃えたいので、Google Colabで Rを実⾏ • 今回は有料版のGPT-4で動かしてます https://chat.openai.com/?model=gpt-4 ChatGPT
本⽇のデータセット • Palmerpenguinsパッケージのデータ (通称ペンギンデータ) • 3種類のペンギンのデータセットです (アデリーペンギン、 ヒゲペンギン、ジェンツーペンギン) https://allisonhorst.github.io/palmerpenguins/
Google Colab で Rを実⾏ • Rの環境構築もばらつきがある のでGoogle Colabにて。 • 気がついたら標準でRに対応し
ていました。ランタイム->ラ ンタイムの変更でR⾔語指定が できます。 (しかしいつの間に・・今まで は⼀⼿間かかってた) • 分析環境が同じだとセミナー とかやりやすくなりますね
以下、ダイジェストにて
①ChatGPTにデータセットについて聞く Q : あなたはR⾔語の palmerpenguinsパッケージとデー タセットを知っていますか?
②ChatGPTに分析⼿順について聞く • Q : R⾔語初⼼者向けに、google colab上でR⾔語を動かし、 palmerpenguinsのデモをしたい と思います。どのような分析をし たら良いか、表形式でアイディア をいただけますか?
②ChatGPTに分析⼿順について聞く • Q : R⾔語初⼼者向けに、google colab上でR⾔語を動かし、 palmerpenguinsのデモをしたい と思います。どのような分析をし たら良いか、表形式でアイディア をいただけますか?
③必要パッケージの導⼊ • Q : 2-4のコードをお願いします。 • ChatGPTにコードの例を出⼒ してもらい、Google Colabで 実⾏して動作確認
• 全体のコードは割愛
③必要パッケージの導⼊ & データ確認 • Q : 2-4のコードをお願いします。 • ChatGPTにコードの例を出⼒ してもらい、Google
Colabで 実⾏して動作確認 • 全体のコードは割愛 Google Colab
④可視化サンプル • Q :ステップ5のサンプルコード をいくつかのパターンでお願いし ます。 • ChatGPTにコードの例を出⼒ してもらい、Google Colabで
実⾏して動作確認 • 全体のコードは割愛
④可視化サンプル • Q :ステップ5のサンプルコード をいくつかのパターンでお願いし ます。 • ChatGPTにコードの例を出⼒ してもらい、Google Colabで
実⾏して動作確認 • 全体のコードは割愛
⑤予測モデルの学習フェーズ • Q : 6-9のステップをお願いしま す。 • モデリング以降も実施 • エラーが出たら修正依頼
• 全体のコードは割愛
補⾜:エラーが出た場合は修正依頼 • Q : Error in eval(family$initialize): y values must
be 0 <= y <= 1 Traceback: • モデリング以降も実施 • エラーが出たら修正依頼 (エラー⽂⾔をそのまま投げれば GPT-4は結構汲み取ってくれます) • 全体のコードは割愛
補⾜:エラーが出た場合は修正依頼 • Q : こちらの変更を加えた、モデリン グパート以降のソースコードを再 度表⽰してください。 • モデリング以降も実施 •
エラーが出たら修正依頼 (エラー⽂⾔をそのまま投げれば GPT-4は結構汲み取ってくれます) • ここから再開して、という指定も 可能 • 全体のコードは割愛
⑥予測モデルの実⾏と結果の評価 • Q :今回作成したモデルの性能評 価を⾏う⼿順を表形式でお願いし ます。 • 性能評価の⽅法確認 • 混同⾏列やROCカーブ
• 全体のコードは割愛
⑥予測モデルの実⾏と結果の評価 • Q :今回作成したモデルの性能評 価を⾏う⼿順を表形式でお願いし ます。 • 性能評価の⽅法確認 • 混同⾏列やROCカーブ
• でもペンギンデータってこんなに 予測性能でるんでしたっ け・・?? • 全体のコードは割愛 怪しい・・
補⾜2:outputの解説依頼 • Outputがテキストばっかりでどう解釈したら良いか分からな い、というときはそれを聞けば解説してくれます
さいごに • ChatGPT x R x Google Colabで楽々データ分析学習 • これから勉強したい!という⽅はChatGPT先⽣を味⽅にしてぜひデータ
分析の世界にもチャレンジされてみてはいかがでしょうか
Enjoy .. !!