Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LT_ChatGPTxRxGoogleColab_ペンギンデータを使って分析・モデリン...
Search
NobuakiOshiro
PRO
May 27, 2023
Science
3
710
LT_ChatGPTxRxGoogleColab_ペンギンデータを使って分析・モデリングを学ぶ
https://fukuoka-r.connpass.com/event/281245/
NobuakiOshiro
PRO
May 27, 2023
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20250503_第1回AIロボット勉強会_自動生成サマリ(ファクトチェック前)
doradora09
PRO
0
6
20250503_第1回aiロボット勉強会
doradora09
PRO
0
12
20250503_ロボティクス関連調査_ディープリサーチ調べ(エビデンスチェック前)
doradora09
PRO
0
7
20250421_Rパッケージと作者をLLMでウォッチする
doradora09
PRO
0
41
20250416_第2回_GenAIアナリティクス勉強会at東京_オープニングトーク
doradora09
PRO
0
19
20250416_既知のテーマであればLLMで特徴量の候補抽出が可能という話
doradora09
PRO
1
70
20250414_生成AIから考える未来社会の可能性と心構え(70min版)_v1.00.pdf
doradora09
PRO
0
69
20250409_OpenAISoraで図面から3Dイメージの動画を作ったらちょっと未来を感じた話
doradora09
PRO
0
50
20250328_OpenAI製DeepResearchは既に一種のAGIだと思う話
doradora09
PRO
0
210
Other Decks in Science
See All in Science
白金鉱業Meetup Vol.16_数理最適化案件のはじめかた・すすめかた
brainpadpr
3
1.6k
02_西村訓弘_プログラムディレクター_人口減少を機にひらく未来社会.pdf
sip3ristex
0
310
データベース01: データベースを使わない世界
trycycle
PRO
1
570
私たちのプロダクトにとってのよいテスト/good test for our products
camel_404
0
290
学術講演会中央大学学員会大分支部
tagtag
0
140
Healthcare Innovation through Business Entrepreneurship
clintwinters
0
210
応用心理学Ⅰテキストマイニング講義資料講義編(2024年度)
satocos135
0
130
統計学入門講座 第1回スライド
techmathproject
0
300
証明支援系LEANに入門しよう
unaoya
0
860
構造設計のための3D生成AI-最新の取り組みと今後の展開-
kojinishiguchi
1
1.1k
サイゼミ用因果推論
lw
1
7.1k
All-in-One Bioinformatics Platform Realized with Snowflake ~ From In Silico Drug Discovery, Disease Variant Analysis, to Single-Cell RNA-seq
ktatsuya
0
360
Featured
See All Featured
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
780
YesSQL, Process and Tooling at Scale
rocio
172
14k
How to Think Like a Performance Engineer
csswizardry
23
1.6k
Writing Fast Ruby
sferik
628
61k
Done Done
chrislema
184
16k
Code Review Best Practice
trishagee
67
18k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
45
7.2k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.8k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
30
2.3k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Mobile First: as difficult as doing things right
swwweet
223
9.6k
How to train your dragon (web standard)
notwaldorf
91
6k
Transcript
LT : ChatGPT x R x Google Colab ペンギンデータを使って 分析・モデリングを学ぶ
2023/05/27 @doradora09
⾃⼰紹介 ⼤城信晃(@doradora09) NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会 九州⽀部 委員⻑ ・住まい
沖縄 -> 東京 -> 福岡 ・職歴 ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業 ・運営コミュニティ ・過去 ・Tokyo.R(2010-2016) ・現在 ・fukuoka.R、PyData.Fukuoka、 意思決定のためのデータ分析勉強会、 オモシロAIごった煮勉強会、ChatGPT部 fukuoka.R運営メンバー。 最近2ヶ⽉はChatGPTばかり触ってます
サテライト観戦での勉強会も企画中 (主に今はTokyo.Rをサテライト観戦) https://satellite-study.connpass.com/
ChatGPT & 本⽇のLTについて • 世間を騒がしているOpenAI社の⼤規 模⾔語モデル • プログラミングもできるので、今回は データ分析初⼼者を想定してChatGPT に分析の⽅法を教えてもらって⾃習で
きるようになるのがゴール • 環境も揃えたいので、Google Colabで Rを実⾏ • 今回は有料版のGPT-4で動かしてます https://chat.openai.com/?model=gpt-4 ChatGPT
本⽇のデータセット • Palmerpenguinsパッケージのデータ (通称ペンギンデータ) • 3種類のペンギンのデータセットです (アデリーペンギン、 ヒゲペンギン、ジェンツーペンギン) https://allisonhorst.github.io/palmerpenguins/
Google Colab で Rを実⾏ • Rの環境構築もばらつきがある のでGoogle Colabにて。 • 気がついたら標準でRに対応し
ていました。ランタイム->ラ ンタイムの変更でR⾔語指定が できます。 (しかしいつの間に・・今まで は⼀⼿間かかってた) • 分析環境が同じだとセミナー とかやりやすくなりますね
以下、ダイジェストにて
①ChatGPTにデータセットについて聞く Q : あなたはR⾔語の palmerpenguinsパッケージとデー タセットを知っていますか?
②ChatGPTに分析⼿順について聞く • Q : R⾔語初⼼者向けに、google colab上でR⾔語を動かし、 palmerpenguinsのデモをしたい と思います。どのような分析をし たら良いか、表形式でアイディア をいただけますか?
②ChatGPTに分析⼿順について聞く • Q : R⾔語初⼼者向けに、google colab上でR⾔語を動かし、 palmerpenguinsのデモをしたい と思います。どのような分析をし たら良いか、表形式でアイディア をいただけますか?
③必要パッケージの導⼊ • Q : 2-4のコードをお願いします。 • ChatGPTにコードの例を出⼒ してもらい、Google Colabで 実⾏して動作確認
• 全体のコードは割愛
③必要パッケージの導⼊ & データ確認 • Q : 2-4のコードをお願いします。 • ChatGPTにコードの例を出⼒ してもらい、Google
Colabで 実⾏して動作確認 • 全体のコードは割愛 Google Colab
④可視化サンプル • Q :ステップ5のサンプルコード をいくつかのパターンでお願いし ます。 • ChatGPTにコードの例を出⼒ してもらい、Google Colabで
実⾏して動作確認 • 全体のコードは割愛
④可視化サンプル • Q :ステップ5のサンプルコード をいくつかのパターンでお願いし ます。 • ChatGPTにコードの例を出⼒ してもらい、Google Colabで
実⾏して動作確認 • 全体のコードは割愛
⑤予測モデルの学習フェーズ • Q : 6-9のステップをお願いしま す。 • モデリング以降も実施 • エラーが出たら修正依頼
• 全体のコードは割愛
補⾜:エラーが出た場合は修正依頼 • Q : Error in eval(family$initialize): y values must
be 0 <= y <= 1 Traceback: • モデリング以降も実施 • エラーが出たら修正依頼 (エラー⽂⾔をそのまま投げれば GPT-4は結構汲み取ってくれます) • 全体のコードは割愛
補⾜:エラーが出た場合は修正依頼 • Q : こちらの変更を加えた、モデリン グパート以降のソースコードを再 度表⽰してください。 • モデリング以降も実施 •
エラーが出たら修正依頼 (エラー⽂⾔をそのまま投げれば GPT-4は結構汲み取ってくれます) • ここから再開して、という指定も 可能 • 全体のコードは割愛
⑥予測モデルの実⾏と結果の評価 • Q :今回作成したモデルの性能評 価を⾏う⼿順を表形式でお願いし ます。 • 性能評価の⽅法確認 • 混同⾏列やROCカーブ
• 全体のコードは割愛
⑥予測モデルの実⾏と結果の評価 • Q :今回作成したモデルの性能評 価を⾏う⼿順を表形式でお願いし ます。 • 性能評価の⽅法確認 • 混同⾏列やROCカーブ
• でもペンギンデータってこんなに 予測性能でるんでしたっ け・・?? • 全体のコードは割愛 怪しい・・
補⾜2:outputの解説依頼 • Outputがテキストばっかりでどう解釈したら良いか分からな い、というときはそれを聞けば解説してくれます
さいごに • ChatGPT x R x Google Colabで楽々データ分析学習 • これから勉強したい!という⽅はChatGPT先⽣を味⽅にしてぜひデータ
分析の世界にもチャレンジされてみてはいかがでしょうか
Enjoy .. !!