AI技術の実応用と実験環境の整備（DRIVE CHARTの脇見検知）

笹木陸・大西健太 1

• DRIVE CHARTの概要 • 脇見検知へのデータサイエンス応用 • 実験環境の整備 2

経歴 2019/4 DeNA 新卒入社 2020/4 Mobility Technologies へ出向笹木陸
/ Riku Sasaki Mobility Technologies 開発本部 AI技術開発部（DeNAより出向） DRIVE CHART データサイエンスチーム @losveria (Kaggle Expert) 4

• 実データから傾向や構造などを理解し、知見を引き出す • それを基に適切な指標を設定し新たな入力に対する予測などを行うモデルを構築するパターンのモデル化新たな知見・
パターンの発見 • 数学・統計学 • ドメイン知識 • データエンジニアリング力などデータの理解 5 統合

7 「移動で人を幸せに。」

8 「移動で人を幸せに。」

引用：警察庁交通局「令和元年中の交通事故の発生状況」 9 法令違反別交通事故割合（2019年）

危険シーンの動画や運転行動の分析結果をフィードバック危険シーンの検知と運転行動の分析 11

• 前方車両検出結果 • レーン検出結果深層学習モデルイベント検知 12 内カメラ映像外カメラ映像
加速度・角速度 GPS エッジサーバ地図各種モデル • 顔ランドマーク検出結果

• DRIVE CHARTの概要 • 脇見検知へのデータサイエンス応用 ◦ 脇見検知の概要 ◦ 脇見検知のモデル ◦
モデル作成上の課題と対策 ◦ テストと運用 • 実験環境の整備 13

視線が正面から下方にそれる状態がある運転速度以上で一定時間継続 14 正常運転脇見運転

• ユーザー体験 ◦ 誤検知ゼロ ◦ シチュエーションや利用者の違いに対しロバストな検知 • コスト ◦
将来的な導入台数の拡大を見据え処理できる計算コスト 15

機械学習モデルコンピュータビジョンを用いた直接的なアプローチ 17 • 顔向き • 目の開き具合 •
顔の大きさなど動画脇見検知特徴量視線方向と関連していると仮定

TechCon 2020 「コンピュータビジョン技術の実応用」 CNNやRNNなどのコンピュータビジョン(CV)技術 18 時系列データと捉えて脇見確率を推定

1. エッジで間接的な特徴量（ランドマーク）を作る 2. 特徴量を基にサーバで脇見候補を絞り込む 3. 脇見候補にのみ高性能なモデルを使う • （サーバ）多くの計算コストと通信コストが必要 • （エッジ）計算量制約・オンラインの脇見予測
• 深層学習は様々なシチュエーションのデータが必要 19 課題

脇見検知モデル軽量な深層学習モデル脇見候補 20 内カメラ動画エッジサーバ
ランドマークセンサデータ脇見検知高性能な深層学習モデル脇見候補動画リクエスト ① ② ③ ④

• 顔向き • 目の開き具合 • カメラとの距離 • 加速度 • 速度
などの特徴量誤差（損失関数）最小化 21 残差残差 ︙ 入力モデル出力脇見確率 (0〜1) アノテーション脇見 (1) または脇見ではない (0)

誤差（損失関数）最小化 23 残差残差 ︙ 入力モデル出力脇見確率
(0〜1) アノテーション脇見 (1) または脇見ではない (0) • 顔向き • 目の開き具合 • カメラとの距離 • 加速度 • 速度などの特徴量

24 車線変更やカーブ時の左方確認 or 脇見前傾姿勢で前方注視 or 脇見
脇見運転の定義が曖昧かつ、類似事象との見分けが困難類似事象の誤検知が発生課題カーブ、車線変更、前傾姿勢、目線のみ前方等

車線変更やカーブ時の左方確認 or 脇見脇見運転の定義が曖昧かつ、類似事象との見分けが困難類似事象の誤検知が発生顔との距離・速度・加速度など脇見と一見関係ない特徴量導入
25 課題前傾姿勢で前方注視 or 脇見顔とカメラの距離で判定加速度で判定カーブ、車線変更、前傾姿勢、目線のみ前方等

26 デバイスや利用者ごとに固有なデータ統一的に扱うと検知に偏りが発生課題カメラの位置、シート位置、目の大きさ等

顔向きや目の大きさのデータ蓄積でデバイス、利用者ごとのモデル作成デバイスや利用者ごとに固有なデータ統一的に扱うと検知に偏りが発生 • 画像処理を考慮した特徴量 • デバイス、利用者ごとにデータを蓄積し特徴量作成
27 課題カメラの位置、シート位置、目の大きさ等

脇見は低頻度で、大部分が脇見でないデータランダムなデータを用いると意味の無いモデルになる 29 正常運転脇見運転課題

ダウンサンプリングでかたより無いモデル作成 30 脇見でないデータを間引くダウンサンプリング脇見は低頻度で、大部分が脇見でないデータランダムなデータを用いると意味の無いモデルになる課題

GBDTモデルによる２クラス分類モデルを複雑にすると精度向上するが、計算コスト増加各フレームの特徴量各フレームの予測 31 残差 ︙
0.1, 0.7, 0.8, 0.1, 0.2, 0.1, 0.9 残差木木課題予測値とラベルとの残差を次の木で予測する

大部分は脇見でないためサンプリング後に予測で高速化 32 残差 ︙ 残差 • 非走行時の予測を飛ばす
• 全フレームではなく、サンプリングと重点的予測 −, , , −, , −, 木木モデル複雑化で精度向上課題 GBDTモデルによる２クラス分類モデルを複雑にすると精度向上するが、計算コスト増加予測値とラベルとの残差を次の木で予測する

34 課題サービス展開まではデータが少なく多様性に欠け、リソースも不十分誤アノテーションも発生する収集効率が悪く、データに偏りと劣化正常脇見

曖昧な部分の重点収集で高精度化 35 課題サービス展開まではデータが少なく多様性に欠け、リソースも不十分誤アノテーションも発生する収集効率が悪く、データに偏りと劣化 • 収集用ロジックの作成
• 境界データのアノテーション正常脇見

間接的な特徴量から、高性能な深層学習モデルと遜色ない検出精度を達成 36 実際に脇見区間で高い確率を出力一定間隔の予測で高速化非運転時は予測せず高速化
一定時間閾値以上で重点的に予測

実験環境での検証 • 実験環境での検証（後半） ◦ 精度が想定通りか • 本番環境での検証 ◦ 検知の分布と精度が想定通りか
• 展開後のモニタリング ◦ 誤判定が発生していないか ◦ 長期的に精度が劣化していないか展開後のモニタリング本番環境での検証データ収集アノテーションモデル作成 38

展開後のモニタリング本番環境での検証実験環境での検証データ収集アノテーションモデル作成 39
• 実験環境での検証（後半） ◦ 精度が想定通りか • 本番環境での検証 ◦ 検知の分布と精度が想定通りか • 展開後のモニタリング ◦ 誤判定が発生していないか ◦ 長期的に精度が劣化していないか

• 実験環境での検証（後半） ◦ 精度が想定通りか • 本番環境での検証 ◦ 検知の分布と精度が想定通りか • 展開後のモニタリング
◦ 誤判定が発生していないか ◦ 長期的に精度が劣化していないか展開後のモニタリング本番環境での検証実験環境での検証データ収集アノテーションモデル作成 40

• ユーザー体験 ◦ 誤検知ゼロ ◦ シチュエーションや利用者の違いに対しロバストな検知 • コスト ◦
将来的な導入台数の拡大を見据え処理できる計算コスト 41 ほとんどゼロ特定の人やシーンでの検知の偏り無し許容可能なコスト更なる低下を目指すデータの徹底的な分析により各課題に対応したデータやモデルを作成することで、要件を満たす脇見検知システムが完成

• DRIVE CHARTではCV・データサイエンス技術をフル活用した脇見検知モデルを開発・運用 • 実データでは様々な課題が存在し、精度以外の要件も考慮したデータ・モデルの設計が重要 • 脇見特有の課題にはデータ整備、分析が特に重要 42

44 経歴 2019/7 DeNA 入社 2020/4 Mobility Technologies 入社大西
健太 / Kenta Onishi Mobility Technologies 開発本部 AI技術開発部 DRIVE CHART MLOpsチーム

• DRIVE CHARTの概要 • 脇見検知へのデータサイエンス応用 • 実験環境の整備 ◦ 評価実験の位置づけと実験環境の要件 ◦
採用した解決策と実験環境の全体像 ◦ Amazon EKS環境へのKubeﬂow Pipelinesの導入 ◦ ETL systemとFeature storeの内製 45

• 実験環境での検証（後半） ◦ 精度が想定通りか • 本番環境での検証 ◦ 検知の分布と精度が想定通りか • 展開後のモニタリング
◦ 誤判定が発生していないか ◦ 長期的に精度が劣化していないか展開後のモニタリング本番環境での検証データ収集アノテーションモデル作成 47 実験環境での検証

48 • サービスで実デバイスから収集されたデータを入力として検出処理を行う ◦ 検証データとサービスのデータで収集条件や分布が異なる場合がある • 大量の運転データを用いて検出処理を行う ◦ 誤検知ゼロの達成には十分なデータ数で評価実験することが重要
◦ 評価実験でも大量のデータを高速に処理できる必要がある • Jupyter notebookなどではなく、サーバのコードを実行して検出処理を行う ◦ サービスと同じコードを動かし、デプロイ後も同じ挙動を保証する

49 • エッジとサーバの一貫試験 • 実験データの収集・生成の自動化 • 前処理済みの特徴量を使った開発・検証 • 動作要件の異なるコンポーネントの連携 •
複数の実験の並行 • 実験手順が簡便

深層学習モデルイベント検知 50 内カメラ動画外カメラ動画加速度・角速度 GPS エッジサーバ
地図各種モデル • 前方車両検出結果 • レーン検出結果 • 顔ランドマーク検出結果

深層学習モデルイベント検知 51 内カメラ動画外カメラ動画加速度・角速度 GPS 地図各種モデル
特徴量の変更も... ロジックの変更も... 最終結果に影響を与える • 前方車両検出結果 • レーン検出結果 • 顔ランドマーク検出結果

深層学習モデルイベント検知 52 エッジサーバ各種モデル • • •

(0〜1) アノテーション脇見 (1) または脇見ではない (0) 前処理済みの特徴量で、モデルの開発や分布の検証などを行いたい • 顔向き • 目の開き具合 • カメラとの距離 • 加速度 • 速度などの特徴量

脇見検知モデル軽量な深層学習モデル脇見候補 55 内カメラ動画エッジ検出サーバ
ランドマークセンサデータ脇見検知高性能な深層学習モデル脇見候補動画リクエスト ① ② ③ ④ 動画推論サーバ

脇見検知モデル軽量な深層学習モデル脇見候補 56 内カメラ動画エッジ検出サーバ
ランドマークセンサデータ脇見検知高性能な深層学習モデル脇見候補動画リクエスト ① ② ③ ④ 動画推論サーバ Python実装 Rust実装軽量なGBDTモデル多段の PyTorchモデル Python実装

57 • 複数人が異なるイベント種別 (脇見や急後退など) を同時に実験 ◦ イベント種別ごとに開発チームや開発フェーズが異なる • 同じイベント種別でも異なるパラメータで同時に実験
◦ Ex. モデルのバージョン間の比較 • ある実験が他の実験に影響を与えてはいけない ◦ 実験に用いた特徴量や実験結果は、実験ごとに独立して保存 ◦ 他の実験でコンピューティングリソースが割かれて実験完了が遅れる、なども避けたい

58 • 多様なバックボーンのスペシャリスト約30名が開発従事 ◦ コンピュータビジョン ◦ エッジAI開発 ◦ データサイエンス ◦
サーバサイド開発 ◦ 経験してきた分野や技術スタック、開発フェーズなどが異なる • 実験は全員が平等に行えるようにしたい ◦ 自分が行った変更に対して、自分で結果まで確認できるようにする ◦ イメージビルドなどの定型作業は自動化する

• Amazon EKS + Kubeﬂow Pipelinesを導入 ◦ ✅ エッジとサーバの一貫試験 ◦
✅ 動作要件の異なるコンポーネントの連携 ◦ ✅ 複数の実験の並行 ◦ ✅ 実験手順が簡便 • ETL systemとFeature storeを内製 ◦ ✅ 実験データの収集・生成の自動化 ◦ ✅ 前処理済みの特徴量を使った開発・検証 60

61 Test Y Test X データセット ETL System Feature
store エッジ検出サーバ推論前処理出力検出前処理出力可視化集計・可視化動画ロジック開発サービス環境 AI環境カメラファイルデプロイデプロイ S3 (ファイルストレージ ) Aurora (RDB) SageMaker (≒ Jupyter Notebook) ECS (コンテナ実行環境 ) Lambda (サーバレス環境 ) 推論出力カメラファイルセンサファイルテーブル EKS 動画推論サーバサービスデータの収集を集約前処理済み特徴量を使って開発実験ごとに独立した実行環境を構築

• (k8s) はコンテナアプリケーション環境の構成管理プラットフォーム ◦ アプリケーション環境は全てコンテナ化されているため、導入が容易 ◦ オートスケーリングやセルフヒーリングをサポート ◦ ワークロードが多様で今後も変化していくため、制約の多いマネージド
サービスの組み合わせでは、拡張性の担保が難しい • でk8sクラスタを構築 ◦ サービスおよびAIの環境にAWSを採用しているため ◦ コントロールプレーンを自分で管理しない 63

64 • は機械学習に関わるワークロードをk8s上で実行するためのツールキット群 ◦ 開発、学習、ワークフロー、サービング等 • ワークフローを担うを採用 ◦
実験管理に特化したパイプラインを構築できる ▪ SDK (Python) も提供されているので簡単に実装できる ◦ k8sインフラの恩恵 (スケーラビリティなど) をそのまま受けられる ◦ リッチなWebインタフェースがデフォルトで提供される ▪ Apache AirﬂowやAWS Step Functions等も検討したが、UIの点で最も使い勝手が良かった

65 Web UIのためブラウザで完結できる実験の一覧過去の実験履歴が一覧化されている実験パラメータの入力パイプラインの実行状況進行状況がグラフでわかる
ボタン1つでスタートボタン1つでスタート

• ユーザとデモを繰り返しながら開発 • 実験条件は可能な範囲でパラメータ化することで、ユーザがコントロールできるようにする ◦ 有効にする機能のトグル (エッジ+サーバやサーバのみ
などのバリエーションに対応) ◦ 実験に用いるエッジやサーバのバージョン • 定型作業はパイプライン上で自動化 ◦ データコピー、ビルド・デプロイなど • 特徴量や途中結果の可視化、AWS Cloudwatch Logsへのログの集約、実験完了のSlack通知など

68 • DRIVE CHARTリリース初期はAI開発者が必要なデータを毎回収集してから実験を行っていた ◦ データソースが多岐 (センサファイル、動画ファイル、テーブルなど) にわたるため、実験ケースごとに要否を適切に判断する必要がある
◦ データの重複保持によるストレージコストの圧迫 ◦ データガバナンスの面でも問題 • データセット管理の仕組み (ETL system) を開発・運用 ◦ 実験データの収集自動化・永続化・共有を実現

69 API Gateway AI環境サービス環境ファイルテーブルコピーコピー Lambda
(API) Lambda (Enq) SQS ECS メタデータ run run update データセット化実験のタイミングで実行開始スケジュールで実行手動実行 CLI + APIで汎用的なインタフェースを提供サーバレスでオートスケール AWSマネージドサービスの組み合わせで実現

70 • “Feature store”は前処理された特徴量を入出力・永続化するためのデータストア ◦ 主に実験の再現性の担保、前処理済みのデータの共有などが目的 ◦ Uber, Airbnb,
NetﬂixなどのMLシステムで同様の仕組みを持っている ◦ CHARTでは前処理済みのセンサデータ (= CSVデータ) などが対象 • プロジェクト用にFeature storeを内製 ◦ OSSのFeature store (feastなど) も候補に上がったが、高機能な一方、想定環境のミスマッチや運用ハードルの高さのため、採用を見送り

71 • センサデータを入出力・永続化に特化した最小構成 ◦ KubeﬂowやJupyter NotebookからPythonクライアントでアクセス ◦ gRPCサーバをRustで実装 ECS Aurora
(メタデータ) S3 (rawデータ) SageMaker Pandas DataFrame と Apache Parquet を相互変換 (通信高速化 + ストレージ削減) 負荷に応じてオートスケール

72 • (実験数の増加) ◦ 環境やデータの準備が自動化され、計画したときにすぐ実験を回せる ◦ 実行環境が分離され、複数の人・複数の条件で同時に実験できる • ◦ 実験で生成された特徴量へ簡単にアクセスできる
▪ 結果の分析 ▪ 特徴量を使った検出処理の改善

73 • DRIVE CHARTではAIの品質の最終チェックとして評価実験を行っている • Kubeﬂow Pipelines + ETL
system + Feature storeで実験環境を構築・運用 • 実際の運転で生成された大量のデータを使った実験が、誰でも実行できるようになった

Mobility Technologiesでは共に働く仲間を積極的に募集してます 74 https://hrmos.co/pages/mo-t

AI技術の実応用と実験環境の整備 （DRIVE CHARTの脇見検知）

AI技術の実応用と実験環境の整備 （DRIVE CHARTの脇見検知）

More Decks by GO Inc. AI Tech

Other Decks in Technology

Featured

Transcript

AI技術の実応用と実験環境の整備（DRIVE CHARTの脇見検知）

AI技術の実応用と実験環境の整備（DRIVE CHARTの脇見検知）