Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Rで始めるML・LLM活用入門
Search
wakama1994
February 28, 2026
Programming
240
0
Share
Rで始めるML・LLM活用入門
SappoRo.R#13での発表内容
https://sapporor.connpass.com/event/378168/
wakama1994
February 28, 2026
More Decks by wakama1994
See All by wakama1994
ド文系だった私が、 KaggleのNCAAコンペでソロ金取れるまで
wakamatsu_takumu
2
2.3k
「実践DataOps」書籍紹介
wakamatsu_takumu
0
64
Kaggleの歩き方-関西Kaggler会に参加してみて-
wakamatsu_takumu
2
670
BQで天気基盤をつくって、役立つ情報を可視化してみた!
wakamatsu_takumu
4
1.3k
「データモデリング実践入門」は20年経っても色あせない
wakamatsu_takumu
4
1.5k
いろんな可視化ツールあるけどggplotて何がいいの?- 複数ツールで比較してみた!-
wakamatsu_takumu
1
1.6k
文系出身でも「アルゴリズム×数学」はスッキリ理解できた!話
wakamatsu_takumu
0
640
ChatGPTにどんなときRを使えばいいか聞いてみた!
wakamatsu_takumu
0
750
A/Bテスト実践ガイド ~真のデータドリブンへ至る信用できる実験とは~
wakamatsu_takumu
1
1.8k
Other Decks in Programming
See All in Programming
AlarmKitで明後日起きれるアラームアプリを作る
trickart
0
140
Structured Concurrency, Scoped Values and Joiners in the JDK 25 26 27
josepaumard
1
160
When benchmarks go bad - what I learned from measuring performance wrong
hollycummins
0
400
Are We Really Coding 10× Faster with AI?
kohzas
0
200
AI駆動開発勉強会 広島支部 第一回勉強会 AI駆動開発概要とワークショップ
hayatoshimiu
0
250
Agentic UI beyond Chats Architecture Patterns & Open Standards @ngMunich 05/2026
manfredsteyer
PRO
0
110
Agentic UI in the Frontend: Architectures with Open Standards @JAX 2026 in Mainz
manfredsteyer
PRO
0
120
Transactional Change Stream Processing With Debezium and Apache Flink
gunnarmorling
1
110
AWSはOSSをどのように 考えているのか?
akihisaikeda
0
130
プロパティの順序で型推論が壊れる!? TypeScript6.0の修正からContext-Sensitivityの仕組みを追う
bicstone
2
140
ReactとSvelteのその先、Ripple-TS / Beyond React and Svelte: Ripple-TS
ssssota
2
360
AI Agent と正しく分析するための環境作り
yoshyum
2
550
Featured
See All Featured
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
2k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
What does AI have to do with Human Rights?
axbom
PRO
1
2.1k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
70
39k
Scaling GitHub
holman
464
140k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
290
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
360
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
3.1k
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.1k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
Documentation Writing (for coders)
carmenintech
77
5.3k
Transcript
Rで始めるML・LLM活用入門 @wakama1994 2026.02.28 SappoRo.R#13
自己紹介 北海道大学 2014-2020 # 法学部→農学院 # 計量政治学 # 湿地景観アーカイブ化 #
R ウェザーニューズ 2020-2023 # データサイエンス # スポーツ気象 # 気候テック # Python # GIS primeNumber 2023-2025 # BI構築 # DataOps # BigQuery # Databricks # Kaggleの自己研鑽 GA technologies 2026.2 - # AIソリューションエンジニア # AI不動産投資 # MLOps #LLMOps #Snowflake 若松 拓夢 l Takumu Wakamatsu ◼ 出身 北海道 小樽市 ◼ SNS: @wakama1994 ◼ Kaggle: 🥇2 🥈1 Competitions Master (2025.10-) 関西Kaggler会 #2の登壇 職場の人と出たコンペ後にソロ金 関西Kaggler会きっかけで記事
機械学習や LLMをどんな環境で 利用してますか?
Rで機械学習が使えるのか? • techblogや技術記事を見ると最近は pythonの利用がほとんど • RでもNotebookがあれば、機械学習はできる • しかし多くの場合は、下記のような制約がある ◦ 汎用的なライブラリーの豊富さが、
pythonと比べて少ない ◦ クラウド環境下での Rがデフォルト機能として入っていない場合が多い (別で構築が必要 ) ◦ 大規模なモデルを回す際に、インフラ系の知識がないと環境構築が難しい
Databricks環境だとRでも実装できる (?) • Databricksの場合、以下の機能が揃っているため ◦ Notebookではプログラミング言語として、 R・python・SQL・scalaの使用が可能 ◦ MLFlowが内蔵されており、機械学習の実験管理や LLMのモデル出力結果も見ることができる
◦ コンピュートリソースについても、 GUI上で比較的簡単に設定が可能 MLflow上での生成AIの回答結果の例
本日の発表 • Databricks上でRでコーディングした ML・LLMの活用例について • デモをNotebookで操作したものをお見 せします!
実装環境について
無料で始められる Databricks環境 Databricks Free Edition • 恒久的にDatabricksが無料で使える環境 • Rの言語サポートなし 無料トライアル
• クレジットで14日間Databricksが使える • R言語のサポートあり
Rを実装するための環境設定 (ワークスペース ) • コンピュートリソースについて「既存のクラウドアカウントを使用」を選択する必要がある ◦ 「デフォルトストレージとサーバレスコンピュート」は R非対応 • AWS
or Azureが対応しているため、資格情報 (AWS: IAM)やストレージ名(AWS: S3)を記載 ◦ AWSは無料のクレジットで 200$(半年)使えるものがあるため、こちらを利用
Rを実装するための環境設定 (Notebook) • Rでの実装はNotebookの各セルの右上を開くことで言語設定が可能 • Rでの実装にあたってはClassical Clusterに設定する必要あり(サーバレスでは不可) ◦ 以下の設定であれば、 AWSの無料枠の中で実装可能
& EC2を別で立ち上げる必要はなかった
実装内容について
参考にしたコード 技術書展#18(2025年)に出版された「MLflowとデータブリックスで はじめる ML/LLM システム構築 [実践]入門」から、リソースやクレジットに限りがある無料トライアルでも 実装可能な以下を取り上げる • Databricks で作る!
ブロードリスニングの⽤法を⽤いたお客様の声分析(13 章) ◦ テキストデータをベクトル化して、ダッシュボードでスコアリング ※ 8章:Databricks + MLflow で回す評価ドリブンの AI Agent 開発や12章: AutoML で挑む 競艇予測モデル のどちらかもデモ予定でしたが、以下の理由で実施できず ...... • AI Agent開発: databricks.sdkがRでは対応していかなった • AutoML: Rで実装する場合のモジュールの問題 ◦ 実験過程は参考資料で後ほど紹介
コーディングについて • 書籍ではSQLとpythonで実装しているが、「pythonの部分をR」に書き換えて実装 • Google GeminiとDatabricks Genie(下図)を使用し、pythonからRに書き換えた
Databricks で作る! ブロードリスニン グの⽤法を⽤いたお客様の声分析
デモ内容 • ブロードニング: 「広範囲に⽤の意⽤を収集し、収集した意⽤を AI で分析‧可視化する⽤法」 • Databricks上で「エンべディング、クラスタリング、ラベリング、可視化」をし、顧客の声を Feed backできる
デモを実装 ※書籍から引用した図
実装のフロー LLMを用いたデータ作成 ai_query() を使⽤して通話内容のサマリ サマリー化した文章をベクトル化 ラベリングとダッシュボードによる可視化
参考資料
AIエージェントの失敗例 • AIエージェントを使用するたいの databricks SDKがRでinstallが不可 ◦ プレビュー版でつい最近リリースされていたが、実行できず。。。。 • Rからpythonを実行できるreticulateで実装を試みるもceredensital系のエラーが出る •
databricks SDKの部分をpythonで実装した場合でも、後続の部分を Rで実装すると失敗。。。。
AutoMLの失敗例 • pythonの場合写真1枚目のようにimport databricks.autmoMLで問題なく実装できた • 一方、Rで実装する場合はreticulateを使ってimportしたが、互換性がないものがあった ◦ distutilsが下記の方法でも installできず.... pythonの場合
Rでもpip install setuptoolsで理論上は行けるはずだが ....
実装したコードについて • 今回実装したコードは下記 GitHubのリポジトリに格納されている ◦ https://github.com/wakama1994/sapporo_r_13_llm_ml ◦ Rでの実装と参考までに pythonのものも載せている •
AI AgentやAuto MLの失敗したNotebookも もしご要望あれば、追加します 笑 ◦ 懇親会等でお声がけください!
最後に
発表のまとめ • Databricks環境ではRを用いてMLやLLMの活用デモを部分的に作成できることがわかった ◦ Sparkやlangchain系のモジュールをインポートすれば、「テキストデータのベクトル化」が可能 • 一方でpythonと互換性のないモジュールも見られた ◦ databricksSDKがないため、AIエージェント開発は難しい ◦
AutoMLについても、pythonのモジュールと互換性が確認できなかった • コンピュートリソースの設定も必須であるため、本格導入を検討される方は有償版の利用を推奨 ◦ ただしRで実装する場合は、今回の実験であったような制約が存在することにも注意が必要
ご清聴ありがとうございました! ※1 東京商工リサーチによる投資用不動産の売上実績(2025年3月調べ) ※2 東京商工リサーチによる投資用不動産会社の売上原価調査(2024年10月調べ)