Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LT_ChatGPTxRxGoogleColab_ペンギンデータを使って分析・モデリン...
Search
NobuakiOshiro
PRO
May 27, 2023
Science
3
740
LT_ChatGPTxRxGoogleColab_ペンギンデータを使って分析・モデリングを学ぶ
https://fukuoka-r.connpass.com/event/281245/
NobuakiOshiro
PRO
May 27, 2023
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20250910_生成AIでスタンドアロンなデータ分析ダッシュボードを作りたい
doradora09
PRO
0
26
20250906_“GPT-5、Cerebras、 あとgpt-oss-120bの話” をしようと思ったら Qwen3-480Bがつよつよだっ た話(テトリスで検証)
doradora09
PRO
0
68
20250901_LT_爆速AI_CerebrasでリアルタイムSVG生成
doradora09
PRO
0
96
20250823_LT_爆速AI_Cerebrasから考える未来
doradora09
PRO
0
48
20250726_DeepResearchで何かしらの情報を調べた後のTips
doradora09
PRO
1
55
20250718_分析業務への生成AI活用(テキストマイニングを例題に)
doradora09
PRO
1
86
20250715_AI時代到来・企業リスクへの生成AI活用術
doradora09
PRO
0
78
20250709_MacStudioとLlama-4Maverickでローカル画像認識
doradora09
PRO
1
70
20250709_第3回_GenAIアナリティクス勉強会at東京_オープニングトーク
doradora09
PRO
0
97
Other Decks in Science
See All in Science
機械学習 - 授業概要
trycycle
PRO
0
250
「美は世界を救う」を心理学で実証したい~クラファンを通じた新しい研究方法
jimpe_hitsuwari
1
160
Machine Learning for Materials (Challenge)
aronwalsh
0
340
Explanatory material
yuki1986
0
410
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
1
140
academist Prize 4期生 研究トーク延長戦!「美は世界を救う」っていうけど、どうやって?
jimpe_hitsuwari
0
170
安心・効率的な医療現場の実現へ ~オンプレAI & ノーコードワークフローで進める業務改革~
siyoo
0
350
データベース03: 関係データモデル
trycycle
PRO
1
270
CV_5_3dVision
hachama
0
150
データベース14: B+木 & ハッシュ索引
trycycle
PRO
0
470
データベース12: 正規化(2/2) - データ従属性に基づく正規化
trycycle
PRO
0
980
点群ライブラリPDALをGoogleColabにて実行する方法の紹介
kentaitakura
1
430
Featured
See All Featured
Optimising Largest Contentful Paint
csswizardry
37
3.4k
Making the Leap to Tech Lead
cromwellryan
135
9.5k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.2k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
140
34k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
850
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.6k
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
Facilitating Awesome Meetings
lara
56
6.6k
The World Runs on Bad Software
bkeepers
PRO
71
11k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Transcript
LT : ChatGPT x R x Google Colab ペンギンデータを使って 分析・モデリングを学ぶ
2023/05/27 @doradora09
⾃⼰紹介 ⼤城信晃(@doradora09) NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会 九州⽀部 委員⻑ ・住まい
沖縄 -> 東京 -> 福岡 ・職歴 ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業 ・運営コミュニティ ・過去 ・Tokyo.R(2010-2016) ・現在 ・fukuoka.R、PyData.Fukuoka、 意思決定のためのデータ分析勉強会、 オモシロAIごった煮勉強会、ChatGPT部 fukuoka.R運営メンバー。 最近2ヶ⽉はChatGPTばかり触ってます
サテライト観戦での勉強会も企画中 (主に今はTokyo.Rをサテライト観戦) https://satellite-study.connpass.com/
ChatGPT & 本⽇のLTについて • 世間を騒がしているOpenAI社の⼤規 模⾔語モデル • プログラミングもできるので、今回は データ分析初⼼者を想定してChatGPT に分析の⽅法を教えてもらって⾃習で
きるようになるのがゴール • 環境も揃えたいので、Google Colabで Rを実⾏ • 今回は有料版のGPT-4で動かしてます https://chat.openai.com/?model=gpt-4 ChatGPT
本⽇のデータセット • Palmerpenguinsパッケージのデータ (通称ペンギンデータ) • 3種類のペンギンのデータセットです (アデリーペンギン、 ヒゲペンギン、ジェンツーペンギン) https://allisonhorst.github.io/palmerpenguins/
Google Colab で Rを実⾏ • Rの環境構築もばらつきがある のでGoogle Colabにて。 • 気がついたら標準でRに対応し
ていました。ランタイム->ラ ンタイムの変更でR⾔語指定が できます。 (しかしいつの間に・・今まで は⼀⼿間かかってた) • 分析環境が同じだとセミナー とかやりやすくなりますね
以下、ダイジェストにて
①ChatGPTにデータセットについて聞く Q : あなたはR⾔語の palmerpenguinsパッケージとデー タセットを知っていますか?
②ChatGPTに分析⼿順について聞く • Q : R⾔語初⼼者向けに、google colab上でR⾔語を動かし、 palmerpenguinsのデモをしたい と思います。どのような分析をし たら良いか、表形式でアイディア をいただけますか?
②ChatGPTに分析⼿順について聞く • Q : R⾔語初⼼者向けに、google colab上でR⾔語を動かし、 palmerpenguinsのデモをしたい と思います。どのような分析をし たら良いか、表形式でアイディア をいただけますか?
③必要パッケージの導⼊ • Q : 2-4のコードをお願いします。 • ChatGPTにコードの例を出⼒ してもらい、Google Colabで 実⾏して動作確認
• 全体のコードは割愛
③必要パッケージの導⼊ & データ確認 • Q : 2-4のコードをお願いします。 • ChatGPTにコードの例を出⼒ してもらい、Google
Colabで 実⾏して動作確認 • 全体のコードは割愛 Google Colab
④可視化サンプル • Q :ステップ5のサンプルコード をいくつかのパターンでお願いし ます。 • ChatGPTにコードの例を出⼒ してもらい、Google Colabで
実⾏して動作確認 • 全体のコードは割愛
④可視化サンプル • Q :ステップ5のサンプルコード をいくつかのパターンでお願いし ます。 • ChatGPTにコードの例を出⼒ してもらい、Google Colabで
実⾏して動作確認 • 全体のコードは割愛
⑤予測モデルの学習フェーズ • Q : 6-9のステップをお願いしま す。 • モデリング以降も実施 • エラーが出たら修正依頼
• 全体のコードは割愛
補⾜:エラーが出た場合は修正依頼 • Q : Error in eval(family$initialize): y values must
be 0 <= y <= 1 Traceback: • モデリング以降も実施 • エラーが出たら修正依頼 (エラー⽂⾔をそのまま投げれば GPT-4は結構汲み取ってくれます) • 全体のコードは割愛
補⾜:エラーが出た場合は修正依頼 • Q : こちらの変更を加えた、モデリン グパート以降のソースコードを再 度表⽰してください。 • モデリング以降も実施 •
エラーが出たら修正依頼 (エラー⽂⾔をそのまま投げれば GPT-4は結構汲み取ってくれます) • ここから再開して、という指定も 可能 • 全体のコードは割愛
⑥予測モデルの実⾏と結果の評価 • Q :今回作成したモデルの性能評 価を⾏う⼿順を表形式でお願いし ます。 • 性能評価の⽅法確認 • 混同⾏列やROCカーブ
• 全体のコードは割愛
⑥予測モデルの実⾏と結果の評価 • Q :今回作成したモデルの性能評 価を⾏う⼿順を表形式でお願いし ます。 • 性能評価の⽅法確認 • 混同⾏列やROCカーブ
• でもペンギンデータってこんなに 予測性能でるんでしたっ け・・?? • 全体のコードは割愛 怪しい・・
補⾜2:outputの解説依頼 • Outputがテキストばっかりでどう解釈したら良いか分からな い、というときはそれを聞けば解説してくれます
さいごに • ChatGPT x R x Google Colabで楽々データ分析学習 • これから勉強したい!という⽅はChatGPT先⽣を味⽅にしてぜひデータ
分析の世界にもチャレンジされてみてはいかがでしょうか
Enjoy .. !!