Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LT_ChatGPTxRxGoogleColab_ペンギンデータを使って分析・モデリン...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
NobuakiOshiro
PRO
May 27, 2023
Science
3
770
LT_ChatGPTxRxGoogleColab_ペンギンデータを使って分析・モデリングを学ぶ
https://fukuoka-r.connpass.com/event/281245/
NobuakiOshiro
PRO
May 27, 2023
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
【中東情勢関連】2026/3/5現在:チャッピー先生調べ・NotebookLMまとめ ( バイアス多め )
doradora09
PRO
0
18
20250110_ChatGPT部2026年の抱負
doradora09
PRO
0
97
[NotebookLM製]20251210_AIによる前処理について
doradora09
PRO
0
17
20251122_第1回ローカルLLMなんでも勉強会_オープニングトーク
doradora09
PRO
0
150
20251122_LT_スマホ版軽量ローカルLLMで人物名マスク
doradora09
PRO
0
150
20251120_LT_AIで今年の漢字を予想する
doradora09
PRO
0
77
20251120_生成AI(LLM)で自習する方法とバイブコーディング入門
doradora09
PRO
0
31
20251025_LT_catgpt_atlasでわかるOpenAI歴
doradora09
PRO
0
60
20251015_LT_BIのAIがAGI過渡期は流行るのではと思った話
doradora09
PRO
0
36
Other Decks in Science
See All in Science
データベース10: 拡張実体関連モデル
trycycle
PRO
0
1.1k
データマイニング - ノードの中心性
trycycle
PRO
0
350
データマイニング - グラフデータと経路
trycycle
PRO
1
300
白金鉱業Meetup_Vol.20 効果検証ことはじめ / Introduction to Impact Evaluation
brainpadpr
2
1.7k
データマイニング - グラフ埋め込み入門
trycycle
PRO
1
180
Lean4による汎化誤差評価の形式化
milano0017
1
450
あなたに水耕栽培を愛していないとは言わせない
mutsumix
1
280
Distributional Regression
tackyas
0
370
シャボン玉の虹から原子も地震も重力も見える! 〜 物理の目「干渉縞」のすごい力 〜
syotasasaki593876
1
110
Text-to-SQLの既存の評価指標を問い直す
gotalab555
1
180
データベース12: 正規化(2/2) - データ従属性に基づく正規化
trycycle
PRO
0
1.1k
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
PRO
0
160
Featured
See All Featured
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
400
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
510
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.3k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Building an army of robots
kneath
306
46k
Side Projects
sachag
455
43k
Agile that works and the tools we love
rasmusluckow
331
21k
The SEO Collaboration Effect
kristinabergwall1
0
380
What's in a price? How to price your products and services
michaelherold
247
13k
エンジニアに許された特別な時間の終わり
watany
106
240k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
380
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Transcript
LT : ChatGPT x R x Google Colab ペンギンデータを使って 分析・モデリングを学ぶ
2023/05/27 @doradora09
⾃⼰紹介 ⼤城信晃(@doradora09) NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会 九州⽀部 委員⻑ ・住まい
沖縄 -> 東京 -> 福岡 ・職歴 ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業 ・運営コミュニティ ・過去 ・Tokyo.R(2010-2016) ・現在 ・fukuoka.R、PyData.Fukuoka、 意思決定のためのデータ分析勉強会、 オモシロAIごった煮勉強会、ChatGPT部 fukuoka.R運営メンバー。 最近2ヶ⽉はChatGPTばかり触ってます
サテライト観戦での勉強会も企画中 (主に今はTokyo.Rをサテライト観戦) https://satellite-study.connpass.com/
ChatGPT & 本⽇のLTについて • 世間を騒がしているOpenAI社の⼤規 模⾔語モデル • プログラミングもできるので、今回は データ分析初⼼者を想定してChatGPT に分析の⽅法を教えてもらって⾃習で
きるようになるのがゴール • 環境も揃えたいので、Google Colabで Rを実⾏ • 今回は有料版のGPT-4で動かしてます https://chat.openai.com/?model=gpt-4 ChatGPT
本⽇のデータセット • Palmerpenguinsパッケージのデータ (通称ペンギンデータ) • 3種類のペンギンのデータセットです (アデリーペンギン、 ヒゲペンギン、ジェンツーペンギン) https://allisonhorst.github.io/palmerpenguins/
Google Colab で Rを実⾏ • Rの環境構築もばらつきがある のでGoogle Colabにて。 • 気がついたら標準でRに対応し
ていました。ランタイム->ラ ンタイムの変更でR⾔語指定が できます。 (しかしいつの間に・・今まで は⼀⼿間かかってた) • 分析環境が同じだとセミナー とかやりやすくなりますね
以下、ダイジェストにて
①ChatGPTにデータセットについて聞く Q : あなたはR⾔語の palmerpenguinsパッケージとデー タセットを知っていますか?
②ChatGPTに分析⼿順について聞く • Q : R⾔語初⼼者向けに、google colab上でR⾔語を動かし、 palmerpenguinsのデモをしたい と思います。どのような分析をし たら良いか、表形式でアイディア をいただけますか?
②ChatGPTに分析⼿順について聞く • Q : R⾔語初⼼者向けに、google colab上でR⾔語を動かし、 palmerpenguinsのデモをしたい と思います。どのような分析をし たら良いか、表形式でアイディア をいただけますか?
③必要パッケージの導⼊ • Q : 2-4のコードをお願いします。 • ChatGPTにコードの例を出⼒ してもらい、Google Colabで 実⾏して動作確認
• 全体のコードは割愛
③必要パッケージの導⼊ & データ確認 • Q : 2-4のコードをお願いします。 • ChatGPTにコードの例を出⼒ してもらい、Google
Colabで 実⾏して動作確認 • 全体のコードは割愛 Google Colab
④可視化サンプル • Q :ステップ5のサンプルコード をいくつかのパターンでお願いし ます。 • ChatGPTにコードの例を出⼒ してもらい、Google Colabで
実⾏して動作確認 • 全体のコードは割愛
④可視化サンプル • Q :ステップ5のサンプルコード をいくつかのパターンでお願いし ます。 • ChatGPTにコードの例を出⼒ してもらい、Google Colabで
実⾏して動作確認 • 全体のコードは割愛
⑤予測モデルの学習フェーズ • Q : 6-9のステップをお願いしま す。 • モデリング以降も実施 • エラーが出たら修正依頼
• 全体のコードは割愛
補⾜:エラーが出た場合は修正依頼 • Q : Error in eval(family$initialize): y values must
be 0 <= y <= 1 Traceback: • モデリング以降も実施 • エラーが出たら修正依頼 (エラー⽂⾔をそのまま投げれば GPT-4は結構汲み取ってくれます) • 全体のコードは割愛
補⾜:エラーが出た場合は修正依頼 • Q : こちらの変更を加えた、モデリン グパート以降のソースコードを再 度表⽰してください。 • モデリング以降も実施 •
エラーが出たら修正依頼 (エラー⽂⾔をそのまま投げれば GPT-4は結構汲み取ってくれます) • ここから再開して、という指定も 可能 • 全体のコードは割愛
⑥予測モデルの実⾏と結果の評価 • Q :今回作成したモデルの性能評 価を⾏う⼿順を表形式でお願いし ます。 • 性能評価の⽅法確認 • 混同⾏列やROCカーブ
• 全体のコードは割愛
⑥予測モデルの実⾏と結果の評価 • Q :今回作成したモデルの性能評 価を⾏う⼿順を表形式でお願いし ます。 • 性能評価の⽅法確認 • 混同⾏列やROCカーブ
• でもペンギンデータってこんなに 予測性能でるんでしたっ け・・?? • 全体のコードは割愛 怪しい・・
補⾜2:outputの解説依頼 • Outputがテキストばっかりでどう解釈したら良いか分からな い、というときはそれを聞けば解説してくれます
さいごに • ChatGPT x R x Google Colabで楽々データ分析学習 • これから勉強したい!という⽅はChatGPT先⽣を味⽅にしてぜひデータ
分析の世界にもチャレンジされてみてはいかがでしょうか
Enjoy .. !!