Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Rで始めるML・LLM活用入門
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
wakama1994
February 28, 2026
Programming
0
190
Rで始めるML・LLM活用入門
SappoRo.R#13での発表内容
https://sapporor.connpass.com/event/378168/
wakama1994
February 28, 2026
Tweet
Share
More Decks by wakama1994
See All by wakama1994
ド文系だった私が、 KaggleのNCAAコンペでソロ金取れるまで
wakamatsu_takumu
2
2.1k
「実践DataOps」書籍紹介
wakamatsu_takumu
0
57
Kaggleの歩き方-関西Kaggler会に参加してみて-
wakamatsu_takumu
2
640
BQで天気基盤をつくって、役立つ情報を可視化してみた!
wakamatsu_takumu
4
1.2k
「データモデリング実践入門」は20年経っても色あせない
wakamatsu_takumu
4
1.4k
いろんな可視化ツールあるけどggplotて何がいいの?- 複数ツールで比較してみた!-
wakamatsu_takumu
1
1.6k
文系出身でも「アルゴリズム×数学」はスッキリ理解できた!話
wakamatsu_takumu
0
630
ChatGPTにどんなときRを使えばいいか聞いてみた!
wakamatsu_takumu
0
730
A/Bテスト実践ガイド ~真のデータドリブンへ至る信用できる実験とは~
wakamatsu_takumu
1
1.7k
Other Decks in Programming
See All in Programming
技術検証結果の整理と解析をAIに任せよう!
keisukeikeda
0
130
Kubernetesでセルフホストが簡単なNewSQLを求めて / Seeking a NewSQL Database That's Simple to Self-Host on Kubernetes
nnaka2992
0
170
AI時代の脳疲弊と向き合う ~言語学としてのPHP~
sakuraikotone
1
1.5k
[SF Ruby Feb'26] The Silicon Heel
palkan
0
120
どんと来い、データベース信頼性エンジニアリング / Introduction to DBRE
nnaka2992
1
320
生成 AI 時代のスナップショットテストってやつを見せてあげますよ(α版)
ojun9
0
290
DevinとClaude Code、SREの現場で使い倒してみた件
karia
1
1.1k
RAGでハマりがちな"Excelの罠"を、データの構造化で突破する
harumiweb
9
3k
Claude Codeセッション現状確認 2026福岡 / fukuoka-aicoding-00-beacon
monochromegane
4
450
モックわからないマン卒業記 ~振る舞いを起点に見直した、フロントエンドテストにおけるモックの使いどころ~
tasukuwatanabe
3
410
Windows on Ryzen and I
seosoft
0
350
メタプログラミングで実現する「コードを仕様にする」仕組み/nikkei-tech-talk43
nikkei_engineer_recruiting
0
200
Featured
See All Featured
Producing Creativity
orderedlist
PRO
348
40k
sira's awesome portfolio website redesign presentation
elsirapls
0
200
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
1.9k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.9k
Abbi's Birthday
coloredviolet
2
5.5k
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
240
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
410
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
180
Music & Morning Musume
bryan
47
7.1k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Testing 201, or: Great Expectations
jmmastey
46
8.1k
Amusing Abliteration
ianozsvald
0
140
Transcript
Rで始めるML・LLM活用入門 @wakama1994 2026.02.28 SappoRo.R#13
自己紹介 北海道大学 2014-2020 # 法学部→農学院 # 計量政治学 # 湿地景観アーカイブ化 #
R ウェザーニューズ 2020-2023 # データサイエンス # スポーツ気象 # 気候テック # Python # GIS primeNumber 2023-2025 # BI構築 # DataOps # BigQuery # Databricks # Kaggleの自己研鑽 GA technologies 2026.2 - # AIソリューションエンジニア # AI不動産投資 # MLOps #LLMOps #Snowflake 若松 拓夢 l Takumu Wakamatsu ◼ 出身 北海道 小樽市 ◼ SNS: @wakama1994 ◼ Kaggle: 🥇2 🥈1 Competitions Master (2025.10-) 関西Kaggler会 #2の登壇 職場の人と出たコンペ後にソロ金 関西Kaggler会きっかけで記事
機械学習や LLMをどんな環境で 利用してますか?
Rで機械学習が使えるのか? • techblogや技術記事を見ると最近は pythonの利用がほとんど • RでもNotebookがあれば、機械学習はできる • しかし多くの場合は、下記のような制約がある ◦ 汎用的なライブラリーの豊富さが、
pythonと比べて少ない ◦ クラウド環境下での Rがデフォルト機能として入っていない場合が多い (別で構築が必要 ) ◦ 大規模なモデルを回す際に、インフラ系の知識がないと環境構築が難しい
Databricks環境だとRでも実装できる (?) • Databricksの場合、以下の機能が揃っているため ◦ Notebookではプログラミング言語として、 R・python・SQL・scalaの使用が可能 ◦ MLFlowが内蔵されており、機械学習の実験管理や LLMのモデル出力結果も見ることができる
◦ コンピュートリソースについても、 GUI上で比較的簡単に設定が可能 MLflow上での生成AIの回答結果の例
本日の発表 • Databricks上でRでコーディングした ML・LLMの活用例について • デモをNotebookで操作したものをお見 せします!
実装環境について
無料で始められる Databricks環境 Databricks Free Edition • 恒久的にDatabricksが無料で使える環境 • Rの言語サポートなし 無料トライアル
• クレジットで14日間Databricksが使える • R言語のサポートあり
Rを実装するための環境設定 (ワークスペース ) • コンピュートリソースについて「既存のクラウドアカウントを使用」を選択する必要がある ◦ 「デフォルトストレージとサーバレスコンピュート」は R非対応 • AWS
or Azureが対応しているため、資格情報 (AWS: IAM)やストレージ名(AWS: S3)を記載 ◦ AWSは無料のクレジットで 200$(半年)使えるものがあるため、こちらを利用
Rを実装するための環境設定 (Notebook) • Rでの実装はNotebookの各セルの右上を開くことで言語設定が可能 • Rでの実装にあたってはClassical Clusterに設定する必要あり(サーバレスでは不可) ◦ 以下の設定であれば、 AWSの無料枠の中で実装可能
& EC2を別で立ち上げる必要はなかった
実装内容について
参考にしたコード 技術書展#18(2025年)に出版された「MLflowとデータブリックスで はじめる ML/LLM システム構築 [実践]入門」から、リソースやクレジットに限りがある無料トライアルでも 実装可能な以下を取り上げる • Databricks で作る!
ブロードリスニングの⽤法を⽤いたお客様の声分析(13 章) ◦ テキストデータをベクトル化して、ダッシュボードでスコアリング ※ 8章:Databricks + MLflow で回す評価ドリブンの AI Agent 開発や12章: AutoML で挑む 競艇予測モデル のどちらかもデモ予定でしたが、以下の理由で実施できず ...... • AI Agent開発: databricks.sdkがRでは対応していかなった • AutoML: Rで実装する場合のモジュールの問題 ◦ 実験過程は参考資料で後ほど紹介
コーディングについて • 書籍ではSQLとpythonで実装しているが、「pythonの部分をR」に書き換えて実装 • Google GeminiとDatabricks Genie(下図)を使用し、pythonからRに書き換えた
Databricks で作る! ブロードリスニン グの⽤法を⽤いたお客様の声分析
デモ内容 • ブロードニング: 「広範囲に⽤の意⽤を収集し、収集した意⽤を AI で分析‧可視化する⽤法」 • Databricks上で「エンべディング、クラスタリング、ラベリング、可視化」をし、顧客の声を Feed backできる
デモを実装 ※書籍から引用した図
実装のフロー LLMを用いたデータ作成 ai_query() を使⽤して通話内容のサマリ サマリー化した文章をベクトル化 ラベリングとダッシュボードによる可視化
参考資料
AIエージェントの失敗例 • AIエージェントを使用するたいの databricks SDKがRでinstallが不可 ◦ プレビュー版でつい最近リリースされていたが、実行できず。。。。 • Rからpythonを実行できるreticulateで実装を試みるもceredensital系のエラーが出る •
databricks SDKの部分をpythonで実装した場合でも、後続の部分を Rで実装すると失敗。。。。
AutoMLの失敗例 • pythonの場合写真1枚目のようにimport databricks.autmoMLで問題なく実装できた • 一方、Rで実装する場合はreticulateを使ってimportしたが、互換性がないものがあった ◦ distutilsが下記の方法でも installできず.... pythonの場合
Rでもpip install setuptoolsで理論上は行けるはずだが ....
実装したコードについて • 今回実装したコードは下記 GitHubのリポジトリに格納されている ◦ https://github.com/wakama1994/sapporo_r_13_llm_ml ◦ Rでの実装と参考までに pythonのものも載せている •
AI AgentやAuto MLの失敗したNotebookも もしご要望あれば、追加します 笑 ◦ 懇親会等でお声がけください!
最後に
発表のまとめ • Databricks環境ではRを用いてMLやLLMの活用デモを部分的に作成できることがわかった ◦ Sparkやlangchain系のモジュールをインポートすれば、「テキストデータのベクトル化」が可能 • 一方でpythonと互換性のないモジュールも見られた ◦ databricksSDKがないため、AIエージェント開発は難しい ◦
AutoMLについても、pythonのモジュールと互換性が確認できなかった • コンピュートリソースの設定も必須であるため、本格導入を検討される方は有償版の利用を推奨 ◦ ただしRで実装する場合は、今回の実験であったような制約が存在することにも注意が必要
ご清聴ありがとうございました! ※1 東京商工リサーチによる投資用不動産の売上実績(2025年3月調べ) ※2 東京商工リサーチによる投資用不動産会社の売上原価調査(2024年10月調べ)