Relevance Filtering for Embedding-based Retrieval

Relevance Filtering for Embedding-based Retrieval Authors: Nicholas Rossi, Juexin Lin,
Feng Liu, Zhen Yang, Tony Lee, Alessandro Magnani, Ciya Liao CIKM '24: Applied Research Papers IR READING 2025春紹介者: (株) UZABASE 飯田大貴特に断りがない限り、図表は本論文からの引用です 1

自己紹介 ▪ 名前：飯田大貴（IR Readingには度々参加させてもらっています） ▪ 所属：(株) ユーザベース • 経済情報基盤を活用して、経営のスピードを上げる情報プラットフォーム
「スピーダ」を提供 ▪ 業務内容：プロダクト横断の検索 /分類モデルの構築とサービスの構築・運用 ▪ インターン等興味あるかたはお声がけください https://www.uzabase.com/jp/ https://www.uzabase.com/jp/info/20241220-corp_jp/ 2

概要と読んだ理由 ▪ 概要：検索結果をPrecision-Recall高く足切りするために、スコアリングの変換関数を提案 ▪ 読んだ理由：簡易な足切り方法を知りたかった。 Applied系の論文読んでみたかった。 3

論文が対象とする課題と解決方針 ▪ 無関係な検索結果を表示しないようにして、検索体験を向上させたい ▪ そのため、いい感じに無関係な検索結果をフィルタしたい ▪ しかし、ベクトル検索で用いられる類似度（特に cos類似度）は、しきい値として用いることが難しい ▪
なぜなら、対照学習を用いて学習されているため、クエリに対して相対的なスコアになる ▪ そのため、cos類似度を絶対的なスコアに変換したい 4

スコアの変換方法 1. 変換関数F Θ (x)を用意する 2. クエリ毎にパラメータΘを変えられるようにする a. パラメタΘをNNに出力させる
b. 入力をクエリ埋め込みとする c. 対照学習時と同様な学習データを用いてNNを学習する正例:負例＝1:31, 負例はBM25 5

推論時の利用方法 6

実験：MSMARCO ▪ PR AUCとMRRが改善 ▪ K=1000でP@R95とFilter％改善 ▪ Null%*について • K=1000で改善し、K=10では改悪。一
つも正例が登場しないクエリが、K=10 では30%だが、K=1000で1%であるため • powerでnull、かつraw scoreがnullではない場合において、70%は正例が top10にない ▪ 先行手法のChoppy#より良い。正例が一つしかない場合が多いデータであるため、削り過ぎている提案手法提案手法 *あるしきい値*で検索結果が返ってこなくなる度合い。しきい値は 5.2.3よりP@R95で決めたと推察 # Transformeベースの学習でしきい値を決める手法 7

分析 ▪ 本手法を適用することで、フィルタリングが改善している • raw scoreでは、全部表示するか、全部見せない場合が多かった ▪ 本手法適用後に正例をフィルタしてし
まうパターンとしては以下があった • 低頻度語がクエリに含まれている • クエリ中の単語がスペルを間違えている全部表示全部隠す 8

実験：WallMartデータ ▪ 提案手法により改善 ▪ Contrastive Lossの方が、Listwise Loss*よりも良い結果 • ListwiseLossの方が、検索結果内で相対的なスコアを学習するため
• 提案手法を適用することで差が縮まる ▪ Recallが低くなるクエリには以下の傾向があった • レアブランド名 • 数字 • スペルミス *先行研究では、単純な精度は ListwiseLossのほうが良かった 9

実験: Walmart システム ▪ Walmartのシステムでオンラインテスト。Rerankerを用いた後の結果。 ▪ Top10 Precisionを人手で確認。Precisionがやや改善 ▪ ビジネス指標（OrderとGross
Merchandise Value)をA/Bテスト。特に改善はなかった 10

事例: Walmart システム ▪ 無関係だったものが、フィルタされている ▪ FilterしてからRerankしているので、10位のやや関係ある商品は出現していると思われる 11

まとめと感想まとめ ▪ 検索結果をPrecision-Recall高く足切りするために、スコアリングの変換関数を提案 ▪ ２つのドメインの異なるデータセットで効果的であることを示した。また、実システムで検証した感想 ▪ Rerankerより簡易にフィルタできるのは良いが、
Rerankerでもよいのでは？ ▪ ドメイン外でも使用可能なのか気になる。難しそう。 Rerankerでもよいのでは？ 12

Relevance Filtering for Embedding-based Retrieval

Relevance Filtering for Embedding-based Retrieval

Hiroki_Iida

More Decks by Hiroki_Iida

Other Decks in Research

Featured

Transcript