タクシー配車アルゴリズムへの強化学習活用:Reinforcement Learning Applications in Taxi dispatching and repositioning domain
タクシー配車における強化学習活用の動向について、DiDi AI Labのアルゴリズムを勉強会用にまとめた資料です。
A survey of reinforcement learning application in taxi dispatching/repositioning domain. The papers are selected mostly from DiDi AI Lab's publications.
(Zhang et al. 2017 KDD2017) ドライバーが配車依頼を自由に選択できる場合にsuccess rateを最適化する問題、乗客のdestination予測 https://www.kdd.org/kdd2017/papers/view/a-taxi-order-dispatch-model-based-on-combinatorial-optimization Large-Scale Order Dispatch in On-Demand Ride-Hailing Platforms: A Learning and Planning Approach (Xu et al. 2018; KDD2018) プラットフォームによる配車割り当ての最適化、系列的な意思決定フレームの導入(長期的なmetricを最大化) https://www.kdd.org/kdd2018/accepted-papers/view/large-scale-order-dispatch-in-on-demand-ride-sharing-platforms-a-learning-a Deep Reinforcement Learning with Knowledge Transfer for Online Rides Order Dispatching (Wang et al. 2018; ICDM2018) 深層学習を組み合わせることによる都市間の転移学習の試み https://ieeexplore.ieee.org/application/enterprise/entconfirmation.jsp?arnumber=8594886 Deep Q-Learning Approaches to Dynamic Multi-Driver Dispatching and Repositioning (Holler et al. 2018; NeurIPS2018 WS) マルチエージェントの検証 https://drive.google.com/file/d/0B_utB5Y8Y6D5MGdfQktjQXgySDdPeG0wYnFxRnBJNDl3UlhF/view ※ 主にDiDi AI Labによる論文を紹介します
◦ ドライバーに送られたオーダー数 ◦ 運転方向とオーダー方向が一致しているか、 … • Order related features ◦ 距離、ETA ◦ 目的地属性(空港、病院、学校、オフィス街、 …) ◦ 経路上の渋滞情報 ◦ 目的地におけるオーダー発生頻度、 … • Driver related features ◦ 過去のaccept rate、直近のaccept傾向 ◦ 普段の営業場所、… • Supplemental features ◦ 曜日、時間(hour of the day) ◦ 近隣のドライバー数、オーダー数、 …