Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ABEMAにおけるLLMを用いたコンテンツベース推薦システム導入と効果検証
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
CyberAgent
PRO
July 25, 2024
Technology
5.6k
7
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
ABEMAにおけるLLMを用いたコンテンツベース推薦システム導入と効果検証
CyberAgent
PRO
July 25, 2024
More Decks by CyberAgent
See All by CyberAgent
「エンジニア進化論」2028年の開発完全自動化、エンジニアはどう進化するか
cyberagentdevelopers
PRO
6
5.3k
NAB Show 2026 動画技術関連レポート / NAB Show 2026 Report
cyberagentdevelopers
PRO
0
200
Local LLM Meetup #1 Opening
cyberagentdevelopers
PRO
0
370
LocalLLMで機密データを匿名化したい
cyberagentdevelopers
PRO
1
370
Vibe Fine-Tuning Version 2 — RunPod SSH で安く学習してみた
cyberagentdevelopers
PRO
0
360
2026年度新卒技術研修 サイバーエージェントのデータベース 活用事例とパフォーマンス調査入門
cyberagentdevelopers
PRO
10
11k
マッチングアプリにおけるユーザー構成の変化は、事業KPIにどう影響しているのか
cyberagentdevelopers
PRO
1
180
Geo-Experiments : ABEMAはなぜ新しい宣伝の効果検証にチャレンジするのか
cyberagentdevelopers
PRO
3
920
ABEMA NEWSにおける PoCをAIプロダクト化する ビジネスリードエンジニアリング
cyberagentdevelopers
PRO
1
470
Other Decks in Technology
See All in Technology
Kiroで書いた 設計書 が AI レビューの 採点基準 になる
ezaki
0
110
AIネイティブな開発のサプライチェーンリスク対策 〜激動の開発現場でリスクに立ち向かう〜【ZennFes】
cscengineer
PRO
2
130
AmazonRoute 53ではじめてのドメイン取得!HTTPS化までの道のりを整理してみた
usanchuu
3
140
ACE-Step-1.5で見る 音楽生成AIのしくみと“破綻だけ直す”Retake機能の開発【zennfes spring 2026 登壇資料】
personabb
1
490
アンオフィシャルな、オフィシャルからのお願い
wyamazak_devrel
0
110
AGENTS.mdとSkillsで始めるAIエージェント活用
sonoda_mj
3
220
200個のGitHubリポジトリを横断調査したかった
icck
0
130
RAG を使わないという選択肢
tatsutaka
1
250
Oracle AI Database@Azure:サービス概要のご紹介
oracle4engineer
PRO
6
2k
2026 TECHFRESH 畢業分享會 - AI-Native 重塑軟體工程與虛擬講師
line_developers_tw
PRO
0
1.1k
不要なレビューをAIにまかせて AIコーディングの環境改善を加速した
shoota
1
150
AIっぽい文章を採点して人間らしく直すアプリを作ってみた
yama3133
2
200
Featured
See All Featured
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.3k
Writing Fast Ruby
sferik
630
63k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.7k
Abbi's Birthday
coloredviolet
2
8.1k
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
2k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
240
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.5k
Paper Plane (Part 1)
katiecoart
PRO
0
9k
Balancing Empowerment & Direction
lara
6
1.2k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
440
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
200
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
470
Transcript
AbemaTV, Inc. All Rights Reserved ABEMAにおけるLLMを用いたコンテンツベース推 薦システム導入と効果検証 2024 July 24
Shuhei Nakano 1
AbemaTV, Inc. All Rights Reserved 2 自己紹介 Nakano Shuhei •
19年新卒 • 株式会社AbemaTV • Engineering Manager of the Search and Recommendation Team • Machine Learning Engineer • X: @nanay_desu
AbemaTV, Inc. All Rights Reserved 本日伝えたいこと 3 [Topic] ABEMAの推薦でLLMを用いたコンテンツベース推薦を導入した [成果]
効果検証を通して推薦指標の向上を確認した [Why] なぜコンテンツベース推薦が必要になったか? • 新規コンテンツ・消費サイクルが短いコンテンツに対して効果的なロジックが必要になっ たため ◦ スケーラビリティー: 大量にコンテンツ来た時耐えるのか? ◦ リードタイム: コンテンツ配信から推薦が機能するまでの時間 [Why] なぜ今まで導入されていなかったのか? • コンテンツベース推薦に必要なメタデータ付与が課題だったため ◦ メタ品質: LLMの登場でサービス導入に耐えうるメタが付与可能になった ◦ 運用負荷: AlloyDBとVertex AIにより完全システム化可能になった
AbemaTV, Inc. All Rights Reserved アイスブレイク 4 Q1. ABEMAを知っている方? Q2.
ABEMAを使ったことがある方? Q3. ABEMAをインストールしている方?
AbemaTV, Inc. All Rights Reserved 5 1. ABEMAの推薦について 2. 既存推薦の課題とコンテンツベース推薦の導入の流れ
3. コンテンツベース推薦システム 4. アーキテクチャ 5. 効果検証 6. まとめ INDEX
AbemaTV, Inc. All Rights Reserved 6 ABEMAの推薦について コンテンツ:番組のこと モジュール:何らかの条件を満たすコンテンツ集合-ァ
AbemaTV, Inc. All Rights Reserved 7 バラエティを選んだあなたへ wrsd ユーザーが 再生中のコンテンツ
ホーム面 視聴面 ABEMAの推薦について コンテンツ :番組のこと (注:エピソード、シーズン、シリーズ) モジュール :何らかの条件を満たすコンテンツ集合-ァ
AbemaTV, Inc. All Rights Reserved 8 モジュール コンテンツ 推薦システムで作成 モジュールを設定
コンテンツ :番組のこと (注:エピソード、シーズン、シリーズ) モジュール :何らかの条件を満たすコンテンツ集合-ァ ABEMAの推薦について バラエティを選んだあなたへ
AbemaTV, Inc. All Rights Reserved 9 システム名 ロジック 具体例 Dragon
ヒューリスティック コンテンツAを視聴したらコンテンツ Bを推薦 ルールベース ルールベース 条件Aを満たすコンテンツを視聴したら条件 Bを満 たすコンテンツを推薦 Yatagarasu 機械学習 視聴履歴の機械学習を利用した推薦 ABEMAの推薦について ABEMAにはモジュールを作成する推薦システムが複数存在する-ァ
AbemaTV, Inc. All Rights Reserved 10 ABEMAにはモジュールを作成する推薦システムが複数存在する ヒューリスティック ルールベース 機械学習
人間が設定 クエリで設定 クエリで設定 人間が設定 機械学習モデルが推論 ABEMAの推薦について
AbemaTV, Inc. All Rights Reserved 11 既存推薦の課題とコンテンツベース推薦の導入の流れ 課題:視聴履歴が十分に蓄積されていないコンテンツに適した推薦システムがない - スケーラビリティー
:大量にコンテンツ来た時耐えるのか? - リードタイム :コンテンツ配信から推薦が機能するまでの時間 新規コンテンツ 消費サイクルが短いコンテンツ スケーラビリティー リードタイム スケーラビリティー リードタイム ヒューリスティッ ク ✖ ✖ ✖ ✖ ルールベース ◯ ✖ ◯ △ 機械学習 ◯ ✖ ◯ ✖ 新規コンテンツ: ABEMAにとって新しいコンテンツ
AbemaTV, Inc. All Rights Reserved 12 既存推薦の課題とコンテンツベース推薦の導入の流れ 課題:視聴履歴が十分に蓄積されていないコンテンツに適した推薦システムがない - スケーラビリティー
:大量にコンテンツ来た時耐えるのか? - リードタイム :コンテンツ配信から推薦が機能するまでの時間 新規コンテンツ 消費サイクルが短いコンテンツ スケーラビリティー リードタイム スケーラビリティー リードタイム ヒューリスティッ ク ✖ ✖ ✖ ✖ ルールベース ◯ ✖ ◯ △ 機械学習 ◯ ✖ ◯ ✖ 消費サイクルが短いコンテンツ:ニュースなどユーザの興味関心に時間的減衰が大 きいもの
AbemaTV, Inc. All Rights Reserved 13 既存推薦の課題とコンテンツベース推薦の導入の流れ 課題:視聴履歴が十分に蓄積されていないコンテンツに適した推薦システムがない - スケーラビリティー
:大量にコンテンツ来た時耐えるのか? - リードタイム :コンテンツ配信から推薦が機能するまでの時間 新規コンテンツ 消費サイクルが短いコンテンツ スケーラビリティー リードタイム スケーラビリティー リードタイム ヒューリスティッ ク ✖ ✖ ✖ ✖ ルールベース ◯ ✖ ◯ △ 機械学習 ◯ ✖ ◯ ✖
AbemaTV, Inc. All Rights Reserved 14 既存推薦の課題とコンテンツベース推薦の導入の流れ 新規コンテンツ 消費サイクルが短いコンテンツ スケーラビリティー
リードタイム スケーラビリティー リードタイム ヒューリスティッ ク ✖ ✖ ✖ ✖ ルールベース ◯ ✖ ◯ △ 機械学習 ◯ ✖ ◯ ✖ 新規コンテンツ - 夜中に対応しなくてはいけない - 人間が設定するのでタイムラグが生じる 消費サイクルが短いコンテンツ - 人間が設定しても劣化してしまう
AbemaTV, Inc. All Rights Reserved 15 ヒューリスティック 人間が設定 人間が設定 ABEMAの推薦について
新規コンテンツ - 夜中に対応しなくてはいけない - 人間が設定するのでタイムラグが生じる 消費サイクルが短いコンテンツ - 人間が設定しても劣化してしまう
AbemaTV, Inc. All Rights Reserved 16 既存推薦の課題とコンテンツベース推薦の導入の流れ 新規コンテンツ 消費サイクルが短いコンテンツ スケーラビリティー
リードタイム スケーラビリティー リードタイム ヒューリスティッ ク ✖ ✖ ✖ ✖ ルールベース ◯ ✖ ◯ △ 機械学習 ◯ ✖ ◯ ✖ 新規コンテンツ - ABEMA内の知見が貯まるまで時間がかかる
AbemaTV, Inc. All Rights Reserved 17 ルールベース クエリで設定 クエリで設定 既存推薦の課題とコンテンツベース推薦の導入の流れ
新規コンテンツ - ABEMA内の知見が貯まるまで時間がかかる
AbemaTV, Inc. All Rights Reserved 18 既存推薦の課題とコンテンツベース推薦の導入の流れ 新規コンテンツ 消費サイクルが短いコンテンツ スケーラビリティー
リードタイム スケーラビリティー リードタイム ヒューリスティッ ク ✖ ✖ ✖ ✖ ルールベース ◯ ✖ ◯ △ 機械学習 ◯ ✖ ◯ ✖ 新規コンテンツ - 視聴履歴が貯まるまで時間がかかる 消費サイクルが短いコンテンツ - 視聴履歴が貯まるまで時間がかかるのでそもそも相性が悪い
AbemaTV, Inc. All Rights Reserved 19 機械学習 機械学習モデルが推論 ABEMAの推薦について 新規コンテンツ
- 視聴履歴が貯まるまで時間がかかる 消費サイクルが短いコンテンツ - 視聴履歴が貯まるまで時間がかかるのでそもそも相性が悪い
AbemaTV, Inc. All Rights Reserved 既存推薦の課題とコンテンツベース推薦の導入の流れ 20 課題のまとめ ヒューリスティック •
新規コンテンツ ◦ 夜中に対応しなくてはいけない ◦ 人間が設定するのでタイムラグが生じる • 消費サイクルが短いコンテンツ ◦ 人間が設定しても劣化してしまう ルールベース • 新規コンテンツ ◦ ABEMA内の知見が貯まるまで時間がかかる 機械学習 • 新規コンテンツ ◦ 視聴履歴が貯まるまで時間がかかる • 消費サイクルが短いコンテンツ ◦ 視聴履歴が貯まるまで時間がかかるのでそもそも相性が悪い 既存の3つの推薦システムだと解決できない →新システムの開発
AbemaTV, Inc. All Rights Reserved 21 既存推薦の課題とコンテンツベース推薦の導入の流れ 新規コンテンツ 消費サイクルが短いコンテンツ スケーラビリティー
リードタイム スケーラビリティー リードタイム ヒューリスティッ ク ✖ ✖ ✖ ✖ ルールベース ◯ ✖ ◯ △ 機械学習 ◯ ✖ ◯ ✖ コンテンツベー ス コンテンツベース推薦システムがこれらの課題を解決するかを説明する
AbemaTV, Inc. All Rights Reserved 22 コンテンツベース推薦システム 視聴したコンテンツ - アニメ
- 異世界もの - アニメ - 異世界もの - スポーツ - サッカー 似ているので推薦 コンテンツ自体の特性(メタデータ)に基づいてユーザーに推薦を行う 仮定:ユーザは内容が似たコンテンツを視聴する
AbemaTV, Inc. All Rights Reserved 23 コンテンツベース推薦システム 視聴したコンテンツ - アニメ
- 異世界もの - アニメ - 異世界もの - スポーツ - サッカー 似ているので推薦 人間 システム メタ情報を付与 コンテンツ自体の特性(メタデータ)に基づいてユーザーに推薦を行う 課題: 精度がメタの品質に依存する コンテンツにメタを付与する運用コストが高い
AbemaTV, Inc. All Rights Reserved 24 コンテンツベース推薦システム 視聴したコンテンツ - アニメ
- 異世界もの - アニメ - 異世界もの - スポーツ - サッカー 似ているので推薦 メタ情報を付与 LLM コンテンツ自体の特性(メタデータ)に基づいてユーザーに推薦を行う 課題: 精度がメタの品質に依存する コンテンツにメタを付与する運用コストが高い
AbemaTV, Inc. All Rights Reserved 25 コンテンツベース推薦システム embedding space LLM
コンテンツ自体の特性(メタデータ)に基づいてユーザーに推薦を行う 課題: 精度がメタの品質に依存する コンテンツにメタを付与する運用コストが高い 解決策: - LLMの近年の進化によって、難易度が下がった
AbemaTV, Inc. All Rights Reserved 26 既存推薦の課題とコンテンツベース推薦の導入の流れ 新規コンテンツ 消費サイクルが短いコンテンツ スケーラビリティー
リードタイム スケーラビリティー リードタイム ヒューリスティッ ク ✖ ✖ ✖ ✖ ルールベース ◯ ✖ ◯ △ 機械学習 ◯ ✖ ◯ ✖ コンテンツベー ス まとめ • コンテンツベースは視聴履歴を必要としないので新規コンテンツ推薦と相性 がいい • LLMを用いてシステム化することで消費サイクルが短いコンテンツにも対応 可能
AbemaTV, Inc. All Rights Reserved 27 システムアーキテクチャ
AbemaTV, Inc. All Rights Reserved 28 コンテンツベース推薦システムの説明 Cloud Load Balancing
Vertex AI AlloyDB ユーザー Gateway Google Kubernetes Engine Recommend Google Kubernetes Engine Batch Worker Google Kubernetes Engine Cloud Load Balancing 入稿 Gateway Google Kubernetes Engine BigQuery embedding部分
AbemaTV, Inc. All Rights Reserved 29 コンテンツベース推薦システムの説明 AlloyDBの選定理由 - コンテンツデータをAlloyDBに移行していた
- AlloyDB AIの機能でVertexAIのモデルを利用できる - AlloyDBからVertexAIの定義済みモデルが直接利用することができる - EmbeddingなどがSQLで完結し、実装コストが低く検証フェーズとも相性がよ い - AlloyDB パフォーマンス - ベクトル検索における近似最近傍探索(ANN)のインデックスを改良したものを 利用できる - 開発に便利な機能が揃っていた - EXPLAINやクエリインサイトでパフォーマンスを確認できる - 読み取り専用のレプリカが作成できる
AbemaTV, Inc. All Rights Reserved 30 効果検証
AbemaTV, Inc. All Rights Reserved 31 効果検証 施策立案 /PRDの作成 モデル選定
オフライン評 価 負荷試験 定性評価 仮説立案 AB初速確認 ABサマリ分 析 リリース 判断 100%適用 インサイト分 析 仮説の 方向性 の妥当 性 AB検証設計 仮説棄却 推薦チーム 施策分析チーム Yes No No
AbemaTV, Inc. All Rights Reserved 32 効果検証 施策立案 /PRDの作成 モデル選定
オフライン評 価 負荷試験 定性評価 仮説立案 AB初速確認 ABサマリ分 析 リリース 判断 100%適用 インサイト分 析 仮説の 方向性 の妥当 性 AB検証設計 仮説棄却 推薦チーム 施策分析チーム Yes No No 効果検証方法を考える 推薦モデルが妥当 か? システム化してパフォーマンス的に問題ないか? ドメイン責任者が最終確認
AbemaTV, Inc. All Rights Reserved 33 効果検証 施策立案 /PRDの作成 モデル選定
オフライン評 価 負荷試験 定性評価 仮説立案 AB初速確認 ABサマリ分 析 リリース 判断 100%適用 インサイト分 析 仮説の 方向性 の妥当 性 AB検証設計 仮説棄却 推薦チーム 施策分析チーム Yes No No マイナス影響の確認 - 改善点はないか? - なぜプラスの効果だったのか?
AbemaTV, Inc. All Rights Reserved ABテストの検証デザイン 34 検証期間 • 1週間
対象デバイス • 全て 推薦システム • Control:ヒューリスティック • Treatment:コンテンツベース推薦 指標 • 5分間視聴
AbemaTV, Inc. All Rights Reserved ABテストの検証結果 (1/2) 35 日付を消す グラフの見方
• オレンジの実線 : 5分視聴回数 の相対比 (Treatment/Control) • 青の実線: 相対比=1の点 (Treatment=Controlとなる 点) • 赤の背景: 実験期間 A/Bテスト検定・時系列を併せてみると5分視聴回数がプラスの影響を受けている 検証期間前のばらつきより検証期間中のばらつきが高い推移をしている
AbemaTV, Inc. All Rights Reserved ABテストの検証結果 (2/2) 36 グラフの見方 •
オレンジの背景: ユーザに表示されや すくなった • 青の背景: ユーザに表示されにくく なった • 赤の点線: 影響を受けなかった ユーザに表示されるコンテンツに変化があった 赤の破線から遠いプロットほど「介入によって表示される数が変わってる」
AbemaTV, Inc. All Rights Reserved LLMコンテンツベースが最強なのか ? 37 類似度: 高 類似度
: 低 ユーザに表示される範囲 embedding space L L M 課題 純粋に内容が近いものがユーザに推薦される 期待 LLMが改善されているので、仕組み化すればメタの品質は向上する? 他の要素を考慮した方がユーザ体験はい い? :トレンド、注目度が高い番組 恐ろしいスピードで改善されていく
AbemaTV, Inc. All Rights Reserved まとめ 38 [Topic] ABEMAの推薦でLLMを用いたコンテンツベース推薦を導入した [成果]
効果検証を通して推薦指標の向上を確認した [Why] なぜコンテンツベース推薦が必要になったか? • 新規コンテンツ・消費サイクルが短いコンテンツに対して効果的なロジックが必要になっ たため ◦ スケーラビリティー: 大量にコンテンツ来た時耐えるのか? ◦ リードタイム: コンテンツ配信から推薦が機能するまでの時間 [Why] なぜ今まで導入されていなかったのか? • コンテンツベース推薦に必要なメタデータ付与が課題だったため ◦ メタ品質: LLMの登場でサービス導入に耐えうるメタが付与可能になった ◦ 運用負荷: AlloyDBとVertex AIにより完全システム化可能になった
AbemaTV, Inc. All Rights Reserved 39 ぜひお話しましょう!本日参加しているメンバー (五十音表記) - 検索推薦チーム
- 井上翔太 / Machine Learning Engineer / @show_5821 - 海老澤 颯 / Machine Learning Engineer / @ebisawa_hayata - 清水 俊樹 / Machine Learning Engineer / @toshiki_ml - 施策分析チーム - 宇戸 慎吾 / Data Scientist / @s1ok69oo - 久保田 大樹 / Data Scientist 最後に