Upgrade to Pro — share decks privately, control downloads, hide ads and more …

DEIM2023-poster-yanagida

 DEIM2023-poster-yanagida

DEIM2023で発表したポスターです.

柳田雄輝, 加藤誠, 河田友香, 山本岳洋, 大島裕明, 藤田澄男. オンラインショッピングにおける満足度と検索行動の関係分析. 第15回データ工学と情報マネジメントに関するフォーラム(DEIM 2023). オンライン&岐阜県岐阜市, Mar. 2023.

YANAGIDA Yuki

March 18, 2023
Tweet

More Decks by YANAGIDA Yuki

Other Decks in Research

Transcript

  1. 商品の絞り込み度合いを捉えるためクエリに意図を割り当てる 分析の流れ 36 クエリ EOS R5 価格 カメラ おすすめ 運動会

    撮影 つくば 天気 クエリログ クエリ 検索意図 EOS R5 価格 検討中 カメラ おすすめ 探索中 運動会 撮影 その他 つくば 天気 その他 クエリ 検索意図 EOS R5 価格 検討中 カメラ おすすめ 探索中 運動会 撮影 探索中 つくば 天気 その他 ルールベースによる 意図の割当 弱教師あり学習による 意図の割当 クエリを分類する = 各意図を時区間ごとに 集計,正規化 時区間 頻度 ログは多量 → 先⾏研究の意図をもとに⾃動で分類 満⾜ 不満⾜ Yahoo! 検索とYahoo! ショッピングのユーザIDを紐付けて分析 発表ID: 3a-4-3 オンラインショッピングにおける満⾜度と検索⾏動の関係分析 柳⽥雄輝, 加藤誠 (筑波⼤), 河⽥友⾹, ⼭本岳洋, ⼤島裕明 (兵庫県⽴⼤), 藤⽥澄男 (ヤフー株式会社) ⽬的 どんなWeb検索をすれば購買に満⾜できる? 分析の流れ RQ1: 購買に満⾜したユーザと不満⾜ なユーザの検索⾏動の違いは? RQ2: 商品やユーザの特性が異なる 場合の検索⾏動の違いは? Web上での情報探索⾏動と購買満⾜度の関係を分析 • 本研究の知⾒によってできるようになること ‒ レビューをしていないユーザに対して,Web検索⾏動から購買満⾜度を予測 • 本研究でも取り組む ‒ 購買満⾜度を⾼めるような検索⽀援 研究⽬的 35 ECサイトで商品を購買する前後のWeb検索⾏動とレビュー評価の関係を分析 ⊃ ≡ 定義 部分集合 対象データ 扱う満⾜度 考慮する 検索⾏動 購買満⾜度の既存研究 ユーザ・商品特性 「購買」満⾜度 ❌ 検索⾏動の既存研究 ログ,被験者実験 「検索」満⾜度 “EC”検索 本研究 ログ,ユーザ・商品特性 「購買」満⾜度 “Web”検索 既存研究との⽐較 • 検討中: 購⼊を検討している段階 ‒ 先⾏研究の Target Finding に相当 ‒ クエリ内にカメラのメーカー名, 型番,商品名のいずれかを含む • 探索中: 商品を探索している段階 ‒ 先⾏研究の Decision Making に相当 ‒ 検討中の条件を満たさず, クエリ内に“カメラ”を含む • その他 検索意図は先⾏研究 [1]をもとに作成 [1] Su et al. User intent, behaviour, and perceived satisfaction in product search. WSDM 2018. RQ3: ユーザが検索に⽤いた語と 満⾜度の関係は? 満⾜度予測 検索に慣れたユーザが⾼めの商品を買う場合のみ, 満⾜したユーザの購買前の頻度が⾼い 満⾜したユーザは購買1週間前の 「検討中」の頻度が⾼い 語のエントロピーを⽐較した結果, 満⾜したユーザは広く検索する傾向 ① BERTによる予測が⾼精度 • クエリの時系列が予測に有⽤な可能性がある ② 特性が予測に⼤きく寄与 • BERTでは訓練データが⾜りず,単語と特性の 組合せを⼗分に学習できていないと考えられる 単語に注⽬した満⾜度予測 44 0.531 0.559 0.530 0.529 0.559 0.548 0.533 0.5 0.52 0.54 0.56 0.58 正解率 検索意図の時間分布 検索意図の時間分布+特性 Bag of Words 埋め込みの平均 埋め込みの平均+特性 BERT BERT+特性 満⾜度予測の正解率 ① BERTによる予測が⾼精度 • クエリの時系列が予測に有⽤な可能性がある ② 特性が予測に⼤きく寄与 • データの8割以上が満⾜クラスに属するため アンダーサンプリングを⾏った結果, BERT では単語と特性の組合せを⼗分に学習できて いないと考えられる ① ② 検証 単語に注⽬した満⾜度予測 0.531 0.559 0.530 0.529 0.559 0.548 0.533 0.5 0.52 0.54 0.56 0.58 正解率 検索意図の時間分布 検索意図の時間分布+特性 Bag of Words 埋め込みの平均 埋め込みの平均+特性 BERT BERT+特性 満⾜度予測の正解率 ① ②                             • 購買前のクエリをクラスタリング RQ3: ユーザが検索に⽤いた語と満⾜度の関係は? 42 C3が最も満⾜の割合が⾼く, C2が最も満⾜の割合が低い                                    (ECサイト名), 店舗 など キャンペーン, セール など 修理, 保証 など クラスタ(C) おすすめ, ⼈気 など ⼝コミ, 評価 など 2017, 新型 など 年数を 調べる 評判を 調べる 購買に関する語群 おすすめ を調べる ECサイト に⾏く 平均的な クラスタ C1 C2 C3 C4 C5 「検討中」での 平均検索回数 「探索中」での 平均検索回数 満⾜したユーザ の割合 平均価格 クラスタ(C) C1 C2 C3 C4 C5 他⼈の意⾒を求めるユーザは 満⾜しやすい可能性がある 「検討中」について,商品の価格とユーザの検索回数 に注⽬,それぞれの中央値で⼆分 「検討中」の意図における頻度の時間分布 RQ1: 購買に満⾜したユーザと不満⾜なユーザの検索⾏動の違いは? 38 0 0.0001 0.0002 0.0003 0.0004 0.0005 (-4w ,-3w ] (-3w ,-2w ] (-2w ,-1w ] (-1w ,0] [0,+ 1w ) [+ 1w ,+ 2w ) [+ 2w ,+ 3w ) [+ 3w ,+ 4w ) 頻度 時区間 満⾜ 不満⾜ 総検索回数で 正規化した値 e.g. [0,+1w): 購買直後 から1 week (w)後以内 購買 3/6 3/10 3/13 3/17 時刻 と を揃えてカウント 購 買 購 買 RQ2: 商品やユーザの特性が異なる場合の検索⾏動の違いは? 40 0 0.0002 0.0004 0.0006 0.0008 満⾜ 不満⾜ 0 0.0002 0.0004 0.0006 0.0008 頻度 0 0.0002 0.0004 0.0006 0.0008 0 0.0002 0.0004 0.0006 0.0008 頻度 (-4w , -3w ] (-3w , -2w ] (-2w , -1w ] (-1w , 0] [0, + 1w ) [+ 1w , + 2w ) [+ 2w , + 3w ) [+ 3w , + 4w ) 購買 ⾼価格 低検索回数 ⾼価格 ⾼検索回数 低価格 ⾼検索回数 低価格 低検索回数 購買 購買 購買