Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLM活用の壁を超える:リクルートR&Dの戦略と打ち手
Search
Recruit
PRO
February 27, 2026
Technology
500
1
Share
LLM活用の壁を超える:リクルートR&Dの戦略と打ち手
2026/2/27に、RECRUIT TECH CONFERENCE 2026で発表した三田の資料になります。
Recruit
PRO
February 27, 2026
More Decks by Recruit
See All by Recruit
AI 時代の Platform Engineering
recruitengineers
PRO
1
230
巨大プラットフォームを進化させる「第3のROI」
recruitengineers
PRO
2
2.8k
データ戦略を加速させる プラットフォーム エンジニアリングと進化的アーキテクチャ
recruitengineers
PRO
2
76
まなび領域における生成AI活用事例
recruitengineers
PRO
2
270
AI時代にエンジニアはどう成長すれば良いのか?
recruitengineers
PRO
1
460
AIを用いたカスタマーサポートの業務プロセス・組織変革の実現
recruitengineers
PRO
1
220
問い合わせ自動化の技術的挑戦
recruitengineers
PRO
2
320
「Air ビジネスツールズ」のクライアントサポートにおける生成 AI 活用
recruitengineers
PRO
0
150
AI活用のためのアナリティクスエンジニアリング
recruitengineers
PRO
2
250
Other Decks in Technology
See All in Technology
サイボウズ、プラットフォームエンジニアリング始めるってよ ― プラットフォームチームの事業貢献と組織アラインメントの強化
ueokande
0
120
Terragrunt x Snowflake + dbt で作るマルチテナントなデータ基盤構築プラットフォーム
gak_t12
0
490
TypeScript の型で副作用の実行順序を制御する
yanaemon
0
100
Gaussian Splattingの実用化 - 映像制作への展開
gpuunite_official
0
200
Claude Code で使える DuckDB Skills を試してみた / DuckDB Skills and Claude Code
masahirokawahara
1
930
Oracle Cloud Infrastructure presents managed, serverless MCP Servers for Oracle AI Database
thatjeffsmith
1
570
R&D 祭 2024 アニメエフェクト作成の効率化
olmdrd
PRO
0
100
Claude Code / Codex / Kiro に AWS 権限を 渡すとき、何を設計すべきか
k_adachi_01
6
1.8k
AIAgentと取り組むKaggle
508shuto
2
410
「強制アップデート」か「チームの自律」か?エンタープライズが辿り着いたプラットフォームのハイブリッド運用/cloudnative-kaigi-hybrid-platform-operations
mhrtech
0
210
Purview 勉強会報告 Microsoft Purview 入門しようとしてみた
masakichixo
1
450
既存プロダクトQAから新規プロダクトQAへ
ryotakahashi
0
160
Featured
See All Featured
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
1
300
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
200
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
Facilitating Awesome Meetings
lara
57
6.8k
Building AI with AI
inesmontani
PRO
1
1k
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
1
310
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.3k
What's in a price? How to price your products and services
michaelherold
247
13k
Navigating Weather and Climate Data
rabernat
0
190
Writing Fast Ruby
sferik
630
63k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
510
Transcript
RECRUIT TECH CONFERENCE 2026 LLM活用の本質:「作る視点」と「使う視点」 LLM活用の壁を超える: リクルートR&Dの戦略と打ち手 データ推進室 三田 雅人
三田 雅人 料理・テニス・ゲーム 経歴 / Career 理化学研究所、CyberAgent AI Labの研究者を経て、 2025年にリクルートにキャリア採用入社。
専門は、自然言語処理、計算心理言語学。 R&D組織にてLLMのプロダクト実装を推進。 2025年言語処理学会年次大会にて最優秀賞受賞。 趣味 / Hobbies プロダクト開発 データ推進室 データテクノロジーラボ部 R&Dグループ 2
リクルートにおけるR&D体制 - WhaleLM - 限られたLLM専門リソースを集中し、R&Dから事業実装のできるチームを育成、 全社レベルの事業優先度の高い中長期プロジェクトにアサイン R-ICT GPT 既製LLMの事業活用 OpenAI(Azure)のGPTシリーズ
中心でプロダクト適用、 Prompt Engineeringがメイン WhaleLM PoC ~ 事業実装 DS/MLEが中心でより高度なモデリング が必要かつ事業クリティカルになりうる LLM活用を推進 3
LLM活⽤フェーズが進み、ニーズがシャープに⾼難易度に 4 • カーセンサー ◦ チャットではなく既存UXに組み込み ➔ システム性能要件(レイテンシ等)が高い ◦ 効果直結の打ち手が明確:
レコメンド再ランキング/レコメンド軸提案 • HR キャリアアシスタントAI ◦ LLMがコア機能 ◦ SLM置換でインパクト大:コスト最適化+UX向上 ※画像はイメージです
⾼度なLLM活⽤でインパクト創出するための⽅針 領域施策実行 共通機能 検証/開発 施策・機能の 横展開 R&D モジュール の切り出し 領域側で
モジュール適用 横展開 機能の高度化 高度化した機能を逆輸入 R&Dから施策化 5
LLM活用の壁 • 非機能要件への対応(レイテンシ/スループット/コスト) ◦ 既存UXに組み込むには応答速度と安定運用が必須(=品質とのトレードオフ) ◦ ➔ 小型化・高速化・運用設計で“必要十分な品質”を保ちながら最適化 • 出力の制御性・指示追従性(フォーマット遵守/一貫性)
◦ 期待通りの形式・粒度・制約で出させないと、後段処理やUIが壊れる (=自由度とのトレードオフ) ◦ ➔ 運用側の制約設計に加え、学習で指示追従性を底上げして、狙い通りの出力を安定化 6
非チャットUIにおける生成文表示 • 課題:LLMで品質の高い生成文は実現できるがレイテンシやコスト面で△ ◦ 例: Gemini-2.5-flashを用いて推薦文を生成 ▪ 想定リクエスト量(30RPS)を保証するためには約970万円/月*1 ▪ レイテンシ:
1380ms/件(5000ms/5件) • 打ち手:SLMおよび推論高速化技術の活用 ◦ 例:SFT・知識蒸留・投機的デコーディング...など ◦ ➔ 性能改善しつつ約17.5倍高速化&運用料金を98.5%削減 モデル 最低要件遵守率 (%) ↑ レイテンシ (ms) ↑ 月額 (¥) ↓ 実タスク GPU=10 GPU=3 gemini-2.5-flash 97.4 1380 N/A N/A 9,700,000 llm-jp-3-150m w/ 蒸留・推論高速化 99.4 79 258 472 145,800 7 *1. 入力トークン:700, クエリあたりの出力レスポンステキストトークン数:150 設定における見積もり(2026年2月時点)
知識蒸留における忠実性改善 • 課題:「ショートカット学習」 ◦ 生徒モデルが教師モデルの推論・出力形式を真似せず、独自フォーマット/冗長回答 に逃げる(=忠実性の低下) • 打ち手:Adaptive Z-score Weighting
(AZ-Weighting) を提案 ◦ 学習中の損失履歴から各サンプルのZ-scoreで難易度を動的に推定 ◦ 教師との乖離が大きい(ショートカットしがちな)サンプルに勾配重みを強めて教師 分布へ寄せる ➔ フォーマット追従性(strict-match)が改善 モデル flexible-extract strict-match GKD [Agarwal+24] 68.69 43.85 w/ AZ-Weighting 69.75 47.16 JSAI2026 発表予定 8 例: GSM8K
まとめ:LLMをプロダクトに“組み込む”ためのR&D • ミッション:LLM専門人材・知見を集約し、R&D〜事業装着を一気通貫で推進する体制を 構築し、全社優先度の高い中長期テーマに集中投下 • 壁① 非機能要件(レイテンシ/スループット/コスト) ◦ SLM+推論高速化で“必要十分な品質”を保ちながらレイテンシ・コスト最適化 •
壁② 制御性・指示追従性(形式遵守/一貫性) ◦ 知識蒸留における忠実性を向上させるための道具立てを研究開発 • R&Dの提供価値: ◦ 横断組織として横展開:成功パターンをモジュール化(学習・推論・評価)して 複数領域・プロダクトへ再利用 ◦ ゼロイチで技術を作る:既存技術では解消が難しいギャップに対しては、 研究アプローチにより新技術を創出して課題解決に向けた道具立てを整備 9