2023/09/12実施の、大阪大学 大学院情報科学研究科 数理最適化寄附講座 最終報告シンポジウムにおける、西村の資料です。
© Recruit Co., Ltd. All Rights Reservedリクルートにおける数理最適化の活用事例と産学連携の取り組み1株式会社リクルート西村 直樹 [email protected]2023/9/12
View Slide
© Recruit Co., Ltd. All Rights Reserved自己紹介2西村 直樹株式会社リクルートデータ推進室アジリティテクノロジー部#販促領域 #人材領域 #入社9年目 #横浜市在住#シニアデータサイエンティスト#Pythonではじめる数理最適化氏名所属タグ
© Recruit Co., Ltd. All Rights ReservedContents1. リクルートのデータ組織2. 数理最適化の産学連携の取り組み3. 数理最適化活用施策の紹介3.1. ビジネス要件付きの推薦商品決定3.2. クーポン配信対象者の決定3.3. 商品価格の決定支援3
© Recruit Co., Ltd. All Rights ReservedContents1. リクルートのデータ組織2. 数理最適化の産学連携の取り組み3. 数理最適化活用施策の紹介3.1. ビジネス要件付きの推薦商品決定3.2. クーポン配信対象者の決定3.3. 商品価格の決定支援4
© Recruit Co., Ltd. All Rights Reservedリクルートのデータ組織: データ推進室5各事業領域のデータ戦略立案・推進を行う領域特化ユニットと領域横断で支援を行う専門職種のユニットが交差するマトリクス型組織データテクノロジーユニットDPU販促1DSU販促2DSU販促3DSU販促4DSUSaaSDSUHRDSUアジリティテクノロジー部 より高度な専門性を基に領域・横断の重要案件の支援を行うDPM1部 DPM2部主務組織(領域戦略の実現のための活動に責任を持つ)DTL部MegagonATL部D3M部(Data Driven Decision Making)データエンジニアリング部データサイエンス・機械学習エンジニアリング部採用・育成を含む専門性強化に責任を持つ
© Recruit Co., Ltd. All Rights Reserved6機械学習による予測のタスクは各事業領域で多く活用されるように すべての技術について、どの事業領域にも十分にひとがいる、というわけではない 数理最適化技術: 解くべき課題を計算機で解ける形の問題としてモデリングする部分にハードルがあり、予測タスクと比べると活用実績は少ない 数理最適化の技術普及や案件探索のために 実施している取り組みと活用事例について紹介リクルートの事業領域の例データ組織での数理最適化技術の活用
© Recruit Co., Ltd. All Rights ReservedContents1. リクルートのデータ組織2. 数理最適化の産学連携の取り組み3. 数理最適化活用施策の紹介3.1. ビジネス要件付きの推薦商品決定3.2. クーポン配信対象者の決定3.3. 商品価格の決定支援7
© Recruit Co., Ltd. All Rights Reserved数理最適化寄附講座との産学連携8● 月次で社内の数理最適化関連の案件を横断的にレビューいただいた● 案件相談会として定期的にレビューいただくことで複数の利点があった① 数理最適化関連の案件相談② 数理最適化セミナー③ 社内事例共有会● 隔週で講義形式のオンラインセミナーを実施いただいた● 広いバックグラウンドのメンバーの案件企画のきっかけとなった● 数理最適化関連の案件担当者が持ち回りで案件共有をした● オブザーバーとして参加いただくことで新たなアプローチの発想が得られた
© Recruit Co., Ltd. All Rights Reserved● 個別案件としては2018年度から実務課題をテーマとした共同研究を実施● 2020年度から月次の頻度で、各回複数領域の案件について議論① 数理最適化関連の案件相談▼ 大阪大学大学院 情報科学研究科年報 2021年度 WEB版より9https://www.ist.osaka-u.ac.jp/japanese/dept/istplaza/R04/IST-Plaza2022.pdf
© Recruit Co., Ltd. All Rights Reserved● 担当者だけでなく専門家や参加者も複眼的に解決策を検討● 客観的な観点が入るため、既存手法調査や検証がより丁寧に10事業領域外分析者案件ディレクター専門家(大学教員)複眼的な検討案件担当分析者複眼的な検討により案件の成功確度が向上利点1. 案件の成功確度の向上
© Recruit Co., Ltd. All Rights Reserved11● ひとりが1期で担当できる案件数には限りがある● 自身の案件に加えて他の案件の検討にも参加することで実課題の解決策の引き出しが増える専門家(大学教員)知見獲得事業領域外分析者案件担当分析者多様な実ケーススタディについての議論により知見獲得利点2. 社内分析者の知見獲得
© Recruit Co., Ltd. All Rights Reserved12● 検討のみ参加していた案件へ、途中から参画を希望してもらい、活躍機会が創出されたことも専門家(大学教員)案件参画事業領域外分析者案件担当分析者技術適性のある案件への参画機会の創出利点3. 社内分析者の活躍機会の創出
© Recruit Co., Ltd. All Rights Reserved社内での数理最適化の技術活用の普及と案件探索を目的として隔週の頻度で開催 応用事例紹介など、案件企画者も対象とする回と、実装者向けに理論的な内容を扱う回を区別してアナウンス 本セミナーがきっかけで、専門外のメンバーが数理最適化の活用を着想された案件も13② 数理最適化セミナー
© Recruit Co., Ltd. All Rights Reserved③ 社内事例共有会数理最適化関連の案件に関わる複数の事業領域のメンバーがあつまり、各回持ち回りで案件共有 ウェブ媒体などでの公開を見据えて、領域固有知識がなくても理解できるか、他の取りうるアプローチはあるかなど議論 オブザーバーとして梅谷先生にも参加いただいた 担当領域に閉じず詳細の事例共有がされ領域横断で取り組む案件も生まれた14@IT連載 「リクルート事例で分かる数理最適化入門」https://atmarkit.itmedia.co.jp/ait/series/28443/
© Recruit Co., Ltd. All Rights ReservedContents1. リクルートのデータ組織2. 数理最適化の産学連携の取り組み3. 数理最適化活用施策の紹介3.1. ビジネス要件付きの推薦商品決定3.2. クーポン配信対象者の決定3.3. 商品価格の決定支援15
© Recruit Co., Ltd. All Rights Reserved背景: ビジネス要件付きの推薦商品決定実務での商品推薦ではビジネス要件を満たすことが求められることがある● 商品の推薦数の上下限● 会員への推薦数の上下限● 推薦総数の上限● 全体推薦効果の下限素朴にスコアの高い順の送付/表示では要件を満たせない場合がある16商品 会員
© Recruit Co., Ltd. All Rights Reserved事例: 全体推薦効果を一定以上担保した上での目標効果達成商品数の最大化● 想定する推薦システムの仕様○ 会員がウェブページに来訪するとその時点の会員の属性と行動の情報に応じて商品が推薦される● ビジネス要件○ 目標効果を達成する商品の数を最大化○ 全体の推薦効果は一定以上を担保○ 会員への推薦商品数の上限あり17商品 会員推薦を偏らせず、目標効果を達成できる商品数を増やしたい
© Recruit Co., Ltd. All Rights Reserved定式化: 全体推薦効果を一定以上担保した上での目標効果達成商品数の最大化定式化できたので解けば解決?18目標効果を達成する商品数の最大化 商品 j の効果が目標効果を超えるときzj= 1 となる 全体の推薦効果は L 以上 各会員に対する推薦商品数は N 以下商品 j が目標効果を達成するとき1,そうでないとき0となる決定変数商品 j の目標効果全体推薦効果の下限会員 i に商品 jを推薦するかどうかの決定変数推薦商品数会員 i へ商品 j を推薦時の推定効果
© Recruit Co., Ltd. All Rights Reserved課題: 問題規模の大きさと訪問者の不確実性19● 問題規模の大きさ○ 商品数と会員数が大きい場合には解くのが難しい○ 整数計画問題のため解ける規模は大きくない● 訪問者の不確実性○ 推薦結果だけでなく、来訪して推薦システムの表出に触れるかどうかも予測が難しい○ 問題の求解後に登録する新規会員には推薦ができない・・・・・・×数が多い訪問しない新規登録
© Recruit Co., Ltd. All Rights Reserved課題に対するアイデア20AがBよりも全体的にスコアが高く、Aは達成だがBは未達に一般的な推薦システムと同様にスコアの降順に選択したとき、元の最適化問題を解いた結果と近くなるようなスコアの調整係数を得たい素朴なスコアによる推薦調整したスコアによる推薦0.30.4調整係数×10.40.6Bのスコアを理想的な結果をもとに調整することで両方達成に調整係数×20.60.80.60.8ABAB
© Recruit Co., Ltd. All Rights Reserved調整係数算出のための二段階最適化の流れ● 一段階目○ 会員についてサンプリングして元の最適化問題を解く→ 小さな問題であれば頻度高く問題を解き直すことができる● 二段階目○ 元の最適化問題と結果が近くなるようなスコアの調整係数を算出するための最適化問題を解く→ 調整係数として扱うことで既存の推薦システムのスコアに対して 素朴に掛け合わせるだけで適用することができる21アイテム推薦における公平性考慮のための二段階最適化, 濱田 賢吾, 西村 直樹, 梅谷 俊治,日本オペレーションズ・リサーチ学会 2023年春季研究発表会
© Recruit Co., Ltd. All Rights Reserved一段階目: 会員についてサンプリングして元の最適化問題を解く22目標効果を達成する商品数の最大化 商品 j の効果がサンプリング率×目標効果を超えるときzj= 1 となる 全体の推薦効果は L×サンプリング率以上 各会員に対する推薦商品数は N 以下サンプリング率サンプリングした会員の集合実用的に解ける程度のサンプリング率にする
© Recruit Co., Ltd. All Rights Reserved二段階目: スコアの調整係数を算出するための最適化問題を解く23制約違反のペナルティ総和の最小化元のスコアGij× 調整係数λjが元問題で推薦されるときにはti以上、推薦されないときにはti以下うまくλjで事前の推薦結果に調整できない際はペナルティpijがかかる制約違反のペナルティ(決定変数)会員 i に対して推薦するか否かのスコア閾値(決定変数)スコアの調整係数(決定変数)一段階目の問題で決めた推薦するか否かの結果サンプリングした会員の分布が全体の会員の分布に近ければ、得られた λjによる補正スコアの高い順に会員 i に対して貪欲に選択することで、元問題を解いた結果と近い結果を得ることが期待できる
© Recruit Co., Ltd. All Rights Reserved実験結果の概要24商品のスコア商品商品のスコアの分布全スコアの総和 商品の目標達成率貪欲法 1,056(110%) 28%(48%)提案手法 955(100%) 58%(100%)最適割当 972(102%) 62%(107%)各手法の数値と対提案手法比※()内は対提案手法比● 提案手法 対 貪欲法○ 提案手法は全体効果 (全スコアの総和) は大きく減らさず、商品の目標スコア達成率は2倍程度改善されている● 提案手法 対 最適割当 (一段階目のみ解いた結果)○ 推薦時に最適化問題を陽に解かない軽量な方法でも、実際に最適化問題を解く場合と近い性能が達成されている目標値貪欲法提案手法
© Recruit Co., Ltd. All Rights Reserved今後のテーマ: ビジネス要件付きの推薦商品決定● 大規模な2部グラフのマッチング問題のよい問題分割○ サービスによっては商品数の規模が大きく、会員数でサンプリングした一段階目の最適化問題も解くのが難しい○ 問題規模が大きくなると素朴な方法でも処理に時間がかかるため、問題分割をして並行処理しなければならない○ 元問題を解いた結果と近い結果が得られるような問題分割をしたい25
© Recruit Co., Ltd. All Rights ReservedContents1. リクルートのデータ組織2. 数理最適化の産学連携の取り組み3. 数理最適化活用施策の紹介3.1. ビジネス要件付きの推薦商品決定3.2. クーポン配信対象者の決定3.3. 商品価格の決定支援26
© Recruit Co., Ltd. All Rights Reserved背景: クーポン配信対象者の決定多くのサービスで、新規会員の初回利用やリピート会員の継続利用を促す目的でのクーポンキャンペーンが実施されている限られたキャンペーン予算のもとで、効果を最大化したい27割引クーポンのイメージ「ギフト券の見方を知りたい(期間・対象メニューなど)」より
© Recruit Co., Ltd. All Rights Reserved事例: 費用制約のもとでのクーポン配信による売上最大化● 想定するクーポン配信システムの仕様○ バッチ処理にて全配信候補の会員に対してクーポンの配信、非配信を決定● ビジネス要件○ 候補会員全体の利用売上の最大化○ 期待費用は一定以下○ クーポンの種類は定額の1種類のみ2810,000円非配信1,000円配信5,000円× 期待売上会員各会員へクーポンを配信/非配信のときの真の売上/費用がわかれば 配信対象者を決定できそう
© Recruit Co., Ltd. All Rights Reserved定式化: 費用制約のもとでのクーポン配信による売上最大化29売上推定値増分の総和の最大化期待費用の総和は一定以下(クーポン額面×クーポン利用確率)クーポン配信(1)/非配信(0)での売上推定値キャンペーン予算クーポン額面配信(1)でのクーポン利用確率推定値会員 i にクーポンを配信するかどうかの決定変数● ナップサック問題となるため、ρi(売上推定値増分/期待費用)の大きな会員の順に貪欲に選択すると xiの線形緩和問題の最適解に定式化できたので解けば解決?
© Recruit Co., Ltd. All Rights Reserved課題: 予測対象が複数存在することにより優先度付けが不安定に30会員 i の真値 10,000 5,000 500 10予測パターン1 12,000 3,000 300 30予測パターン2 20,000 17,500 250 10誤差大誤差小それぞれで予測モデルを作成すると、各予測モデルは誤差が小さくても優先度ρiの誤差が大きくなってしまうことがある誤差小 誤差小誤差大 誤差大 誤差大 誤差小配信の売上 非配信の売上 配信の費用
© Recruit Co., Ltd. All Rights Reserved既存手法: Transformed outcomeMaciej Jaskowski and Szymon Jaroszewicz. Uplift modeling for clinical trial data.In ICML Workshop on Clinical Data Analysis, Vol. 46, pp. 79–95, 2012.31会員A 300円 ? ?B ? 200円 ?C 250円 ? ?会員A 300円 ? 600円B ? 200円 −400円C 250円 ? 500円観測データからは介入有無での売上差は入手不可能学習データ中の Ti=1 の比率左表はp=0.5で計算売上差の不偏推定となるように、riを目的変数として予測モデルを1つ学習配信の売上観測値非配信の売上観測値配信するかどうかの{0,1}
© Recruit Co., Ltd. All Rights Reserved課題に対するアイデア32定額のインセンティブ付与における予算制約を考慮したアップリフトモデリング, 松井 諒生, 吉住 宗朔,西村 直樹, 小林 健, 中田 和秀, 日本オペレーションズ・リサーチ学会 2023年春季研究発表会会員の利用履歴 (売上>0) を学習データとして、ρiを直接目的変数として学習するような予測モデルを作成したい配信予約確率 × 配信観測売上 非配信予約確率 × 非配信観測売上配信予約確率ー配信予約確率配信売上期待値 ー 非配信売上期待値∝=優先度ρi:=配信費用期待値配信観測売上非配信予約確率ー配信予約確率× 非配信観測売上
© Recruit Co., Ltd. All Rights Reservedクーポン配信の優先度算出の流れ優先度ρi33● 優先度算出モデルの学習○ 会員 i の特徴量をもとに の推定値 を推論○ Si(Ti)>0のデータを用いて優先度を算出○ 優先度 riを会員 i の特徴量をもとに学習 ● 優先度算出モデルによる推論○ 会員 i の特徴量をもとに riの推定値を算出配信観測売上非配信予約確率ー配信予約確率× 非配信観測売上∝特定の仮定のもとでの期待値がρiに対する不偏推定量に
© Recruit Co., Ltd. All Rights Reserved実験結果の概要34提案手法ランダムTransformed outcome/費用予測全会員に付与した場合を1とする費用の利用比率※ Kevin Hillstrom: MineThatData● ECサイトでのRCTメール配信の公開データ※に対して売上ごとに定額費用がかかる設定で検証● 10-fold CVの結果の平均と95%信頼区間を記載費用あたりの売上増分提案手法は売上差、費用を個別に予測し優先度付けした既存手法に比べて費用を利用したときに売上増分が大きくなる対象に配信できている限られた会員に対してクーポン配信するとき特に効果差が大きい
© Recruit Co., Ltd. All Rights Reserved今後のテーマ: クーポン配信対象者の決定● 複数種類、定額以外などの状況での拡張○ 500円/1000円/1500円など多種のクーポン○ 10%引きなどの定率のクーポン● 長期効果 (Lifetime value) の考慮○ 短期効果を最大化する配信対象と、長期効果も加味した場合の配信対象は異なるのでは○ 長期効果も加味しつつ、A/Bテストは短期間で実施したい35
© Recruit Co., Ltd. All Rights ReservedContents1. リクルートのデータ組織2. 数理最適化の産学連携の取り組み3. 数理最適化活用施策の紹介3.1. ビジネス要件付きの推薦商品決定3.2. クーポン配信対象者の決定3.3. 商品価格の決定支援36
© Recruit Co., Ltd. All Rights Reserved背景: 商品価格の決定支援37価格運用者明確な方針暗黙の方針売上を最大化利益率目標はX%商品価格を市況に合わせて細かく人手で調整するのは労力を要する 人手で設定するのと遜色のない商品価格を迅速に設定したい 価格設定のビジネス要件には明文化されたものもあれば暗黙知化されているものもある価格操作範囲は...1日の価格操作数は...景況がいいときには...
© Recruit Co., Ltd. All Rights Reserved事例: 商品カテゴリごとの暗黙の価格操作範囲の自動推定38価格運用者明確な方針暗黙の方針売上を最大化利益率目標はX%価格操作範囲は...1日の価格操作数は...景況が良いときには...目的関数: 期待売上 (最大化)制約条件: 全体利益率期待値 ≧ 目標利益率下限 ≦ 価格 ≦ 上限下限 ≦ 価格操作数 ≦ 上限特定の条件での制約条件商品カテゴリごとの価格割当問題過去データから暗黙の制約条件を特定● 想定する価格提案システムの仕様○ 全体利益率目標や価格操作範囲などのパラメータを厳密な値ではなく何段階かの程度で価格運用者が入力する● ビジネス要件○ 方針に沿い、手動修正が少なくなるような提案価格(利益率)リストを作成
© Recruit Co., Ltd. All Rights Reserved具体例: 各カテゴリごとの商品価格操作の可視化39価格操作前利益率 価格操作前利益率 価格操作前利益率価格操作後利益率カテゴリA カテゴリB カテゴリC● カテゴリごとに価格操作が実行される範囲が異なる→ 提示する価格操作の実行可能範囲を個別に設定することが必要利益率1.0から1.2に値上げ操作
© Recruit Co., Ltd. All Rights Reserved既存手法: 数値属性相関ルール (最適確信度相関ルール)40支持度の最低値が与えられたもとで確信度が最大の区間を算出する価格操作前利益率価格操作後利益率支持度 =確信度 =選択区間の操作領域数すべての区間の操作領域数選択区間の領域数選択区間の操作領域数Fukuda, T., Morimoto, Y., Morishita, S., & Tokuyama, T. (1999). Mining optimized association rules for numericattributes. Journal of Computer and System Sciences, 58(1), 1-12.例:最低支持度80%のときの最適区間支持度 = 5/6 (83%) , 確信度 = 5/5
© Recruit Co., Ltd. All Rights Reserved課題: 推定操作範囲の過去データに対する過剰適合41● 価格操作前利益率区間ごとに独立に最適区間を推定した場合サンプルサイズが少ない部分が極端な範囲をとる(過剰適合)● 得られた範囲について解釈が難しい(暗黙知の理解の観点)→ そのまま価格設定範囲の制約条件として利用するのは適さない最低支持度90%の最適区間の例価格操作前利益率価格操作後利益率価格操作前利益率価格操作後利益率操作前利益率区間:0.1 操作前利益率区間:0.011.0は0.9よりも下限が低い?
© Recruit Co., Ltd. All Rights Reserved課題に対するアイデア42価格操作範囲の特性を運用者へのインタビューをもとにした知見により修正価格操作前利益率価格操作後利益率価格操作範囲の特性① 価格操作上下限の単調性 (操作前利益率が高いほど上下限は高い) ② 価格操作上限の凹性(上限増加幅は操作前利益率が高くなるにつれ減少) ③ 価格操作下限の凸性(下限増加幅は操作前利益率が高くなるにつれ増加)①+②①+③レベニューマネジメントにおける暗黙知を考慮した最適化モデルの自動構成, 西村 直樹, 池田 春之介,木村 隆介, 梅谷 俊治, 第23回情報論的学習理論ワークショップ(IBIS2020)
© Recruit Co., Ltd. All Rights Reserved定式化: 価格操作の特性を考慮した範囲修正43操作領域数が多い操作前利益率範囲 r の上下限に重みをつけ、単調性・凹性・凸性の制約のもとで誤差が最小となるよう操作範囲を修正操作前利益率範囲 rの操作領域数操作前利益率範囲 rの操作後利益率上限の修正値・算出値 〃下限の修正値・算出値上下限の算出値との重み付き2乗誤差最小化価格操作上限の単調性価格操作下限の単調性価格操作上限の凹性価格操作下限の凸性価格操作上限の推定値は下限の推定値より大①②③43
© Recruit Co., Ltd. All Rights Reserved実験結果の概要44算出値(補正なし) ①単調性補正 ②③凹性凸性補正操作前利益率区間0.01操作前利益率区間0.1①②③単調性凹性凸性補正● 提案手法の範囲修正モデルにより操作範囲は以下のように修正された● 5-fold CVによる範囲誤差は①②③の修正を加えた場合が最も良い
© Recruit Co., Ltd. All Rights Reserved今後のテーマ: 商品価格の決定支援45● 最適化結果をよくするような予測モデルの学習○ 価格などを入力とした売上予測モデルの学習と、売上予測を入力とした最適化を別に実施するのでなく、最適化結果を良くするような予測モデルを直接学習したい● ビジネス観点の評価方法の確立○ 価格付けは商品推薦などのタスクと異なりユーザーごとに価格を変えたA/Bテストが難しい○ システムで決定した提案価格が運用者によって必ず適用されるとは限らない
© Recruit Co., Ltd. All Rights Reservedその他の事例46● キッチンモニターでの調理順提案○ 調理遅れ時間の総和の最小化○ 注文された料理は調理される ● TVCMの出稿割当の決定○ 全対象CMの視聴者の最大化○ 各CMへの視聴者数を担保 ● フリーペーパーの配送計画○ 総移動距離の最小化○ ドライバーやトラック積載量の制約条件を遵守@IT連載 「リクルート事例で分かる数理最適化入門」https://atmarkit.itmedia.co.jp/ait/series/28443/
© Recruit Co., Ltd. All Rights Reservedおわりに47● 数理最適化関連のリクルートの産学連携の取り組みと事例を紹介● 今後のテーマとした課題について興味をもっていただいた方や、一緒に取り組んでくださる方がいれば、ぜひお声掛けください