Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Rで始めるML・LLM活用入門
Search
wakama1994
February 28, 2026
Programming
220
0
Share
Rで始めるML・LLM活用入門
SappoRo.R#13での発表内容
https://sapporor.connpass.com/event/378168/
wakama1994
February 28, 2026
More Decks by wakama1994
See All by wakama1994
ド文系だった私が、 KaggleのNCAAコンペでソロ金取れるまで
wakamatsu_takumu
2
2.2k
「実践DataOps」書籍紹介
wakamatsu_takumu
0
59
Kaggleの歩き方-関西Kaggler会に参加してみて-
wakamatsu_takumu
2
650
BQで天気基盤をつくって、役立つ情報を可視化してみた!
wakamatsu_takumu
4
1.2k
「データモデリング実践入門」は20年経っても色あせない
wakamatsu_takumu
4
1.4k
いろんな可視化ツールあるけどggplotて何がいいの?- 複数ツールで比較してみた!-
wakamatsu_takumu
1
1.6k
文系出身でも「アルゴリズム×数学」はスッキリ理解できた!話
wakamatsu_takumu
0
630
ChatGPTにどんなときRを使えばいいか聞いてみた!
wakamatsu_takumu
0
740
A/Bテスト実践ガイド ~真のデータドリブンへ至る信用できる実験とは~
wakamatsu_takumu
1
1.7k
Other Decks in Programming
See All in Programming
AI時代の脳疲弊と向き合う ~言語学としてのPHP~
sakuraikotone
1
1.8k
GoのDB アクセスにおける 「型安全」と「柔軟性」の両立 - Bob という選択肢
tak848
0
310
Coding as Prompting Since 2025
ragingwind
0
740
Goの型安全性で実現する複数プロダクトの権限管理
ishikawa_pro
2
1.4k
飯MCP
yusukebe
0
480
PHPで TLSのプロトコルを実装してみるをもう一度しゃべりたい
higaki_program
0
180
仕様漏れ実装漏れをなくすトレーサビリティAI基盤のご紹介
orgachem
PRO
8
4.8k
おれのAgentic Coding 2026/03
tsukasagr
1
130
Everything Claude Code OSS詳細 — 5層構造の中身と導入方法
targe
0
160
Vibe하게 만드는 Flutter GenUI App With ADK , 박제창, BWAI Incheon 2026
itsmedreamwalker
0
540
PDI: Como Alavancar Sua Carreira e Seu Negócio
marcelgsantos
0
100
「接続」—パフォーマンスチューニングの最後の一手 〜点と点を結ぶ、その一瞬のために〜
kentaroutakeda
5
2.5k
Featured
See All Featured
VelocityConf: Rendering Performance Case Studies
addyosmani
333
25k
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.1k
Joys of Absence: A Defence of Solitary Play
codingconduct
1
330
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
エンジニアに許された特別な時間の終わり
watany
106
240k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
200
The SEO identity crisis: Don't let AI make you average
varn
0
430
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
250
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.3k
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.1k
Abbi's Birthday
coloredviolet
2
6.4k
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
170
Transcript
Rで始めるML・LLM活用入門 @wakama1994 2026.02.28 SappoRo.R#13
自己紹介 北海道大学 2014-2020 # 法学部→農学院 # 計量政治学 # 湿地景観アーカイブ化 #
R ウェザーニューズ 2020-2023 # データサイエンス # スポーツ気象 # 気候テック # Python # GIS primeNumber 2023-2025 # BI構築 # DataOps # BigQuery # Databricks # Kaggleの自己研鑽 GA technologies 2026.2 - # AIソリューションエンジニア # AI不動産投資 # MLOps #LLMOps #Snowflake 若松 拓夢 l Takumu Wakamatsu ◼ 出身 北海道 小樽市 ◼ SNS: @wakama1994 ◼ Kaggle: 🥇2 🥈1 Competitions Master (2025.10-) 関西Kaggler会 #2の登壇 職場の人と出たコンペ後にソロ金 関西Kaggler会きっかけで記事
機械学習や LLMをどんな環境で 利用してますか?
Rで機械学習が使えるのか? • techblogや技術記事を見ると最近は pythonの利用がほとんど • RでもNotebookがあれば、機械学習はできる • しかし多くの場合は、下記のような制約がある ◦ 汎用的なライブラリーの豊富さが、
pythonと比べて少ない ◦ クラウド環境下での Rがデフォルト機能として入っていない場合が多い (別で構築が必要 ) ◦ 大規模なモデルを回す際に、インフラ系の知識がないと環境構築が難しい
Databricks環境だとRでも実装できる (?) • Databricksの場合、以下の機能が揃っているため ◦ Notebookではプログラミング言語として、 R・python・SQL・scalaの使用が可能 ◦ MLFlowが内蔵されており、機械学習の実験管理や LLMのモデル出力結果も見ることができる
◦ コンピュートリソースについても、 GUI上で比較的簡単に設定が可能 MLflow上での生成AIの回答結果の例
本日の発表 • Databricks上でRでコーディングした ML・LLMの活用例について • デモをNotebookで操作したものをお見 せします!
実装環境について
無料で始められる Databricks環境 Databricks Free Edition • 恒久的にDatabricksが無料で使える環境 • Rの言語サポートなし 無料トライアル
• クレジットで14日間Databricksが使える • R言語のサポートあり
Rを実装するための環境設定 (ワークスペース ) • コンピュートリソースについて「既存のクラウドアカウントを使用」を選択する必要がある ◦ 「デフォルトストレージとサーバレスコンピュート」は R非対応 • AWS
or Azureが対応しているため、資格情報 (AWS: IAM)やストレージ名(AWS: S3)を記載 ◦ AWSは無料のクレジットで 200$(半年)使えるものがあるため、こちらを利用
Rを実装するための環境設定 (Notebook) • Rでの実装はNotebookの各セルの右上を開くことで言語設定が可能 • Rでの実装にあたってはClassical Clusterに設定する必要あり(サーバレスでは不可) ◦ 以下の設定であれば、 AWSの無料枠の中で実装可能
& EC2を別で立ち上げる必要はなかった
実装内容について
参考にしたコード 技術書展#18(2025年)に出版された「MLflowとデータブリックスで はじめる ML/LLM システム構築 [実践]入門」から、リソースやクレジットに限りがある無料トライアルでも 実装可能な以下を取り上げる • Databricks で作る!
ブロードリスニングの⽤法を⽤いたお客様の声分析(13 章) ◦ テキストデータをベクトル化して、ダッシュボードでスコアリング ※ 8章:Databricks + MLflow で回す評価ドリブンの AI Agent 開発や12章: AutoML で挑む 競艇予測モデル のどちらかもデモ予定でしたが、以下の理由で実施できず ...... • AI Agent開発: databricks.sdkがRでは対応していかなった • AutoML: Rで実装する場合のモジュールの問題 ◦ 実験過程は参考資料で後ほど紹介
コーディングについて • 書籍ではSQLとpythonで実装しているが、「pythonの部分をR」に書き換えて実装 • Google GeminiとDatabricks Genie(下図)を使用し、pythonからRに書き換えた
Databricks で作る! ブロードリスニン グの⽤法を⽤いたお客様の声分析
デモ内容 • ブロードニング: 「広範囲に⽤の意⽤を収集し、収集した意⽤を AI で分析‧可視化する⽤法」 • Databricks上で「エンべディング、クラスタリング、ラベリング、可視化」をし、顧客の声を Feed backできる
デモを実装 ※書籍から引用した図
実装のフロー LLMを用いたデータ作成 ai_query() を使⽤して通話内容のサマリ サマリー化した文章をベクトル化 ラベリングとダッシュボードによる可視化
参考資料
AIエージェントの失敗例 • AIエージェントを使用するたいの databricks SDKがRでinstallが不可 ◦ プレビュー版でつい最近リリースされていたが、実行できず。。。。 • Rからpythonを実行できるreticulateで実装を試みるもceredensital系のエラーが出る •
databricks SDKの部分をpythonで実装した場合でも、後続の部分を Rで実装すると失敗。。。。
AutoMLの失敗例 • pythonの場合写真1枚目のようにimport databricks.autmoMLで問題なく実装できた • 一方、Rで実装する場合はreticulateを使ってimportしたが、互換性がないものがあった ◦ distutilsが下記の方法でも installできず.... pythonの場合
Rでもpip install setuptoolsで理論上は行けるはずだが ....
実装したコードについて • 今回実装したコードは下記 GitHubのリポジトリに格納されている ◦ https://github.com/wakama1994/sapporo_r_13_llm_ml ◦ Rでの実装と参考までに pythonのものも載せている •
AI AgentやAuto MLの失敗したNotebookも もしご要望あれば、追加します 笑 ◦ 懇親会等でお声がけください!
最後に
発表のまとめ • Databricks環境ではRを用いてMLやLLMの活用デモを部分的に作成できることがわかった ◦ Sparkやlangchain系のモジュールをインポートすれば、「テキストデータのベクトル化」が可能 • 一方でpythonと互換性のないモジュールも見られた ◦ databricksSDKがないため、AIエージェント開発は難しい ◦
AutoMLについても、pythonのモジュールと互換性が確認できなかった • コンピュートリソースの設定も必須であるため、本格導入を検討される方は有償版の利用を推奨 ◦ ただしRで実装する場合は、今回の実験であったような制約が存在することにも注意が必要
ご清聴ありがとうございました! ※1 東京商工リサーチによる投資用不動産の売上実績(2025年3月調べ) ※2 東京商工リサーチによる投資用不動産会社の売上原価調査(2024年10月調べ)