Upgrade to Pro — share decks privately, control downloads, hide ads and more …

深層学習と古典的画像アルゴリズムを組み合わせた類似画像検索内製化

 深層学習と古典的画像アルゴリズムを組み合わせた類似画像検索内製化

第63回 コンピュータビジョン勉強会@関東の発表資料。
https://kantocv.connpass.com/event/344139/

概要:
世界182ヶ国に1100万人超の会員を有し、出品数630万品を超える CtoC EC サイト BUYMA を運営する株式会社エニグモにおいて、類似画像検索システムを内製化した事例をご紹介します。 BUYMA の出品商品名寄せのために、これまで他社製の類似画像検索システムを利用していました。深層学習と古典的画像アルゴリズムを組み合わせた手法を開発し、同等の精度を維持しつつ約8〜9割のコスト削減を実現しました。

詳細を記載した技術ブログ:
https://tech.enigmo.co.jp/entry/2024/11/15/101000
https://tech.enigmo.co.jp/entry/2024/12/05/070000

Shuto Takahashi

February 17, 2025
Tweet

More Decks by Shuto Takahashi

Other Decks in Technology

Transcript

  1. 名前: 髙橋 蹴人(Shuto Takahashi) 所属及び役職: 株式会社エニグモ データテクノロジーグループ データサイエンティスト 担当業務例: ・レコメンド ・生成AIを利用した機能 ・類似画像検索

    ・マーケティングコスト最適化 X(旧 Twitter):s_takahashi_st 関心: ・機械学習関連の知識を得て、自身の課題に応用し結果を知ること ・機械学習をビジネス成果に結びつけること 自己紹介
  2. 会社概要 世界各国のパーソナルショッパーから 世界中のファッションアイテムを購入 できるマーケットプレイス 世界中のリアルなトレンドがわかる ファッション・コスメ・ライフスタ イルを提案するWebメディア 海外旅行者に対して海外在住の日本人 が現地でのプライベートツアーを提供 できるサービス

    BUYMA TRAVEL 社名  株式会社エニグモ (英文社名: Enigmo Inc) 事業内容 インターネットビジネスの企画・開発・運営 所在地 東京都港区赤坂8-1-22 NMF青山一丁目ビル 6F 設立 2004年 2月10日 代表者 代表取締役 最高経営責任者 須田 将啓 従業員数 150名(2024年1月末時点) 上場市場 東京証券取引所 プライム市場 資本金 3億8190万円
  3. サービス紹介「 BUYMA 」 BUYMAは、世界各国のパーソナルショッパー(出品者)から、 世界中のファッションアイテムを購入できるマーケットプレイス。 日 本 未 上 陸

    ブランド、 国 内 完 売 アイテムをはじめとした 世界中のファッショントレンドアイテムからコスメ、インテリア雑貨 まで幅広く揃えています。 ※2024年10月末時点 世界182カ国に1100万人以上の会員を擁する ソーシャルショッピングサイト※
  4. • 内製化の目的、事業インパクト • BUYMA における類似画像検索の課題 • 類似画像検索手法の説明 類似画像検索のロジック部分のみ話します。 システム化部分など他の部分の詳細は弊社技術ブログに記載しています。 発表外のことが気になった方はぜひご覧いただけますと幸いです。

    ・コスト削減と精度維持を両立!類似画像検索システムの内製化成功事例(機械学習編) ・コスト削減と精度維持を両立!類似画像検索システムの内製化成功事例(システム編) アジェンダ
  5. 画像から商品部分を切り抜き、その部分同士で類似度計算 処理ステップ: 1.商品画像内の物体存在箇所をセグメンテーションし切り抜き 2.切り抜いた画像の Embedding 計算 3.Embedding により画像同士の類似度計算 4.画像ハッシュにより画像同士の類似度計算 5.Embedding

    類似度と画像ハッシュ類似度を組合せ同一商品の可能性判定 Embedding:画像を数値の列に変換したもの 画像ハッシュ:視覚的特徴を数値化し簡略化した表現 各ステップの詳細は技術ブログに記載 類似画像検索方法の概要 [0.2, 0.8, 0.4, 0.1, …] [0.3, 0.7, 0.1, 0.1, …] Embedding 類似度: x.xxx 画像ハッシュ類似度: y 同一商品可能性判定 1. 1. 2. 2. 3. 4. 5.
  6. ステップ4: 画像ハッシュによる類似度計算 Embedding 類似度のみでは防げない誤検知を抑止 Embedding 類似度が過剰に 高くなってしまうパターンがあった Embedding 類似度が一定以上の組み合わせについて画像ハッシュ類似度計算 画像ハッシュ:

    視覚的特徴を簡略化し比較する古典的アルゴリズムで、大まかな構造の類似が分かる 例えば、Average Hash (aHash) では大まかに言うと画素値が平均よりも高いかで2値化して比較