Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
qeMLパッケージの紹介
Search
bob3bob3
December 15, 2023
Science
0
1.5k
qeMLパッケージの紹介
caretやtidymodelsと同じような機械学習のラッパーqeMLパッケージの紹介
bob3bob3
December 15, 2023
Tweet
Share
More Decks by bob3bob3
See All by bob3bob3
Rでコンジョイント分析 2024年版
bob3bob3
0
430
『改訂新版前処理大全』の話と Apache Parquet の話 #TokyoR
bob3bob3
0
290
R言語の環境構築と基礎 Tokyo.R 112
bob3bob3
0
430
『データ可視化学入門』をPythonからRに翻訳した話(増強版)
bob3bob3
0
390
『データ可視化学入門』を PythonからRに翻訳した話
bob3bob3
1
460
「国と音楽」 ~spotifyrを用いて~ #muana
bob3bob3
2
420
パーマーステーションのペンギンたち#3 探索的データ分析(EDA)編
bob3bob3
1
550
Redditで遊ぼう #TokyoR 106
bob3bob3
0
610
シン・初心者のためのR-Tips
bob3bob3
0
430
Other Decks in Science
See All in Science
Machine Learning for Materials (Lecture 8)
aronwalsh
0
400
ICRA2024 速報
rpc
3
4.8k
Running llama.cpp on the CPU
ianozsvald
0
350
Coqで選択公理を形式化してみた
soukouki
0
160
ベイズ最適化をゼロから
brainpadpr
2
580
LIMEを用いた判断根拠の可視化
kentaitakura
0
260
20分で分かる Human-in-the-Loop 機械学習におけるアノテーションとヒューマンコンピューターインタラクションの真髄
hurutoriya
4
1.9k
私たちのプロダクトにとってのよいテスト/good test for our products
camel_404
0
120
(Forkwell Library #48)『詳解 インシデントレスポンス』で学び倒すブルーチーム技術
scientia
2
1.3k
AI科学の何が“哲学”の問題になるのか ~問いマッピングの試み~
rmaruy
1
2k
はじめての「相関と因果とエビデンス」入門:“動機づけられた推論” に抗うために
takehikoihayashi
16
6.6k
Science of Scienceおよび科学計量学に関する研究論文の俯瞰可視化_ポスター版
hayataka88
0
100
Featured
See All Featured
Creatively Recalculating Your Daily Design Routine
revolveconf
215
12k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
43
2k
The Invisible Customer
myddelton
119
13k
What's new in Ruby 2.0
geeforr
340
31k
How to train your dragon (web standard)
notwaldorf
85
5.6k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
230
17k
Code Review Best Practice
trishagee
62
16k
Building Flexible Design Systems
yeseniaperezcruz
325
37k
The Illustrated Children's Guide to Kubernetes
chrisshort
47
48k
Facilitating Awesome Meetings
lara
49
5.9k
Git: the NoSQL Database
bkeepers
PRO
425
64k
Building Adaptive Systems
keathley
36
2.1k
Transcript
qeMLパッケージの紹介 R研究集会2023 (2023/12/16) @bob3bob3
qeMLパッケージとは? • caret、mlr3、tidymodelsと同じような、機械 学習に統一的なインターフェイスを提供する ラッパー。 • 「qe」は「quick and easy」。 •
とにかくシンプルで「 one liner」で機械学習を 事項できるのが売り。
作者 Norman Matloff The Art of R Programming (2011) の著者。
実行例 library(qeML) # メジャーリーガーのデータセット。ポジション、身長、体重、年齢 data(mlb1) # 体重を推定するモデル # 決定木、ランダムフォレスト、勾配ブースティング mlb1_rpart
<- mlb1 |> qeRpart("Weight") mlb1_rf <- mlb1 |> qeRFranger("Weight") mlb1_gb <- mlb1 |> qeGBoost("Weight")
実行例 # 推定 new_data <- data.frame(Position='Catcher', Height=73, Age=28) mlb1_rpart |>
predict(new_data) mlb1_rf |> predict(new_data) mlb1_gb |> predict(new_data) # これだけ! # 簡単だね!
Enjoy?
いやいや、まてまて • バリデーションは? • ハイパーパラメーターのチューニングは?
バリデーションは勝手にやってくれる # testデータでのMAE mlb1_rpart$testAcc mlb1_rf$testAcc mlb1_gb$testAcc data.frame( name = c("rpart",
"rf", "gb"), MAE = list(mlb1_rpart, mlb1_rf, mlb1_gb) |> map_dbl(\(x) pluck(x, "testAcc")) ) |> arrange(MAE) # name MAE # 1 rf 13.23741 # 2 gb 13.74169 # 3 rpart 14.24358
チューニングもできる # ランダムフォレストのグリッドサーチ例 qs_ft_rf <- mlb1 |> qeFT( "Weight", "qeRFranger",
pars = list(nTree= seq(100, 1000, 250), minNodeSize= seq(10, 30, 10)), nTst = 100, nXval = 10, showProgress=TRUE ) qs_ft_rf$outdf |> slice_min(meanAcc) # nTree minNodeSize meanAcc CI bonfCI # 1 350 10 8.326976 8.531146 8.653432
その他の機能 • 次元縮約、次元削減 • 並列化 • 欠損補完 • モデルの比較 •
Quick Start, ML Overviewなど親切なビネットがたくさん! • データセットも山盛り
……ただし • まだまだ開発中で発展途上。 • ドキュメントも書きかけという感じ。 • 実装されている手法がcaret、tidymodelsと比べるとまだ少ない。 • 実装が不完全な手法もある(xgboost, lightgbmなど)
• バリデーションの評価指標を変更ができない • Macだとインストールできないらしい(誰か検証して!)
Enjoy!