Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
CCSE2020 メルカリにおけるEdgeAIを用いた 新たなUXの開発
Search
oshima
December 11, 2020
Technology
360
0
Share
CCSE2020 メルカリにおけるEdgeAIを用いた 新たなUXの開発
oshima
December 11, 2020
More Decks by oshima
See All by oshima
CCSE2023 大規模言語モデルのZero-shot Learningを用いたデータ構築と開発への応用
yujioshima
2
470
メルカリのLLMを使ったサービス開発の進め方
yujioshima
0
310
生成系AI/LLM に関する 注目アップデート ~MS Build 2023 編~
yujioshima
5
2.7k
MLOps勉強会 そのEdgeAIはUXを 改善できるか
yujioshima
1
1.3k
Mercar Gears MercariにおけるEdgeAIについて
yujioshima
0
270
MLSE モバイル向け機械学習モデル管理基盤
yujioshima
2
3.4k
Other Decks in Technology
See All in Technology
Generative UI × A2UI で AI エージェントを作った話 AI-DLC も使ってみた!
kmiya84377
1
290
Cloud Run のアップデート 触ってみる&紹介
gre212
0
270
Fabric-cicd によるAzure DevOps デプロイ
ryomaru0825
0
170
地元にいないローカルオーガナイザーの立ち回り
uvb_76
1
400
JJUG CCC 2026 Spring AI時代の開発こそ標準化を武器に! ― 方式・プロセス・プラットフォームの標準化
s27watanabe
2
640
PHP と TypeScript の型システム比較:AI 時代の「型」は誰のためにあるのか? #frontend_phpcon_do / frontend_phpcon_do_2026
shogogg
1
190
ITエンジニアを取り巻く環境とキャリアパス / A career path for Japanese IT engineers
takatama
4
1.8k
Claude Codeを組織で使いこなす— サーバサイドAIエージェント運用の実践知
techtekt
PRO
0
140
Claude Codeですべての日常業務を爆速化しよう!
minorun365
PRO
17
16k
React、まだ楽しくて草
uhyo
7
2.2k
管理アカウント単一運用からAWS Organizationsに移行するの大変で滅
hiramax
0
360
「コーディング」しない人のための Claude Code 入門 ChatGPT の次の一歩 — 業務に組み込む 育成・共有・自動化
rfdnxbro
2
490
Featured
See All Featured
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.3k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
22k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9.1k
So, you think you're a good person
axbom
PRO
2
2k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.8k
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
310
Marketing to machines
jonoalderson
1
5.3k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.4k
Heart Work Chapter 1 - Part 1
lfama
PRO
7
36k
Transcript
メルカリにおけるEdgeAIを用いた 新たなUXの開発 CCSE2020 大嶋悠司
自己紹介 大嶋 悠司 2019/12 ~ Tech Lead of EdgeAI team
in Mercari • EgeAI機能開発/研究・モデル作成・プラットフォーム構築 • OSS活動: ◦ Kubeflow katib (owner) ◦ Docker infrakit (maintainer) • Github: YujiOshima • Twitter: @overs_5121
発表の流れ • EdgeAIとは・EdgeAIチームの取り組み • 機能開発(要件定義) • 機能開発(POC開発) • 機能開発(技術課題洗い出し)
EdgeAIとは MLモデルの推論を端末上で行う 1 sec 〜 〜 50ms インタラクティブなUXを実現
EdgeAIチームの取り組み 画像分類: アイテムを撮影すると即座にカテゴリを推定 MLの推論を端末上で行うことでインタラクティブなUXを実現 リリース済み
EdgeAIチームの取り組み 自然言語(IME): 入力に基づき動的に表示を調整 トライアル中 MLの推論を端末上で行うことでインタラクティブなUXを実現
EdgeAIチームの取り組み 物体検出・追跡: カメラに映る物体をリアルタイムに追跡 この機能の開発を例に 開発中 MLの推論を端末上で行うことでインタラクティブなUXを実現
開発の流れ 要件定義 社内ユーザテスト POC作成 技術課題洗い出し
要件定義
10 売れるかチェック アイテムを撮影すると • 売れている価格平均 • 売り切れ率 がわかる UXを改善し利用率を上げたい
11 利用率を向上のために 結果表示 タップ 領域検出 類似商品検索 写真撮影 カメラ画面 売れるかチェックのステップを分解
12 ボトルネックの調査 結果表示 タップ 領域検出 類似商品検索 写真撮影 カメラ画面 ここでやめてしまうお客様が多い 写真の撮影は想定以上にハードルが高いのでは?
写真撮影のステップをなくせないか
13 ボトルネックの調査 結果表示 タップ 領域検出 類似商品検索 写真撮影 カメラ画面
14 ボトルネックの調査 結果表示 タップ 領域検出 類似商品検索 写真撮影 カメラ画面
15 領域検出を端末上で行う 結果表示 タップ 類似商品検索 領域検出 カメラ画面
16 POC作成+ユーザテスト
17 領域検出を端末上で行う
18 • 物体検出の精度は十分 • タップすればいいことが伝わりにくい 社内ユーザテスト 物体検出とともに売れやすい価格などの 情報提示もリアルタイムに行いたい
19 領域検出を端末上で行う 結果表示 タップ 類似商品検索 領域検出 カメラ画面
20 情報提示までリアルタイムに 結果表示 類似商品検索 領域検出 カメラ画面
21 情報提示までリアルタイムに 結果表示 類似商品検索 領域検出 カメラ画面 画像転送に時間が かかる
22 特徴量抽出 情報提示までリアルタイムに 結果表示 類似商品検索 領域検出 カメラ画面 011010 010101 011...
23 特徴量抽出 情報提示までリアルタイムに 結果表示 類似商品検索 領域検出 カメラ画面 011010 010101 011...
転送量を大幅に軽減
24
25 技術課題洗い出し
26 リリースのために解決すべき課題 • モデルサイズと精度のトレードオフ • 端末の熱・電池消費の問題
27 モデルサイズと精度のバランス アーキテクチャ Precision/mAP Recall/AR@100 モデルサイズ SSD-mobilenetv2 0.56 0.66 18MB
SSDLite-mobilenetv2 0.56 0.67 12MB SSDLite-mobilenetv3-small 0.38 0.5 3.7MB SSDLite-mobiledet 0.59 0.71 13.8MB モデルの精度だけを追求することはできない 実行デバイスで推論速度も違う
28 Edgeモデル検証用プラットフォーム モデル学習 参考:MLSE モバイル向け機械学習モデル管理基盤
29 Edgeモデル検証用プラットフォーム モデル学習 参考:MLSE モバイル向け機械学習モデル管理基盤 精度・モデルサイズや 実デバイス上の推論速度を可視化
30 デバイスごとのベンチマーク iPhone 11 iPhone 8 CoreML GPU CPU XNNPack
31 端末の熱・電池消費の問題 30 FPS ・・・
32 端末の熱・電池消費の問題 参考: Mediapipeを活用したストリーミング推論の事例紹介-カメラをかざして家の中から売れるアイテムを探そう 端末上での処理をパイプラインで表現 • 並列化 • 重い処理の計算頻度を下げる
33 端末の熱・電池消費の問題
34 まとめ • どこまでを端末上で行うか,どれくらいの精度が必要か ◦ ユーザテストとPOCを繰り返す • 端末上での処理能力や熱の問題 ◦ MLの精度の追求は難しい
◦ サイズ検証や実機ベンチマークを自動化 ◦ UXを損なわないレベルで計算コストを下げるチューニング 課題 • リリース後のログの設計 • モデルの更新基盤