[IR Reading 2026春論文紹介] LLM-based Listwise Reranking under the Effect of Positional Bias (ECIR 2026) /IR-Reading-2026-Spring

[論文紹介] LLM-based Listwise Reranking under the Effect of Positional Bias
(ECIR 2026) Jingfen Qiao, Jin Huang, Xinyu Ma, Shuaiqiang Wang, Dawei Yin, Evangelos Kanoulas, Andrew Yates University of Amsterdam, University of Cambridge, Baidu Inc., Johns Hopkins University SB Intuisions株式会社プロダクト開発本部 Sarashina開発部 Applied AI チーム新田洸平 2026年5月27日 IR Reading 2026 春一般セッション2 No. 5 ※スライド中の図表は論文より引用

2 ©︎ 2026 SB Intuitions Corp. どんな論文？ • LLM ベースの
Listwise Reranking 手法における位置バイアスを逆傾向スコアとデータ拡張によって除去する手法 DebiasFirst を提案[1] ◦ ECIR 2026 Best Paper Award ◦ LLM ベースリランカーに最近興味があり紹介 [1] Qiao et al., LLM-based Listwise Reranking under the Effect of Positional Bias, ECIR 2026.

3 ©︎ 2026 SB Intuitions Corp. 背景：LLMベースリランカーとは？1/2 • 1st stage
の検索結果上位 k 件に対して LLM で並び替えるリランキング手法 A B C D: 適合 E D: 適合 C B A E LLM-based Reranker 上位 k 件出力ランキング 1st stage Retriever 検索対象文書膨大な検索対象の中から効率的に適合文書を獲得 e.g., BM25, SPLADE etc. 高コストだが適合文書を高精度に上位にランク付け

4 ©︎ 2026 SB Intuitions Corp. 背景：LLMベースリランカーとは？2/2 • 1st stage
の検索結果上位 k 件に対して LLM で並び替えるリランキング手法【リランカーの種類】 ⚫ Pointwise ⚫ Pairwise ⚫ Listwise ← これ【主な Listwise 手法】 ⚫ 全体予測 ⚫ [2] > [12] > [3] > … を生成 ⚫ 単一トークン生成 ← これ ⚫ 1回のデーコードで得られるロジットを利用 ⚫ リランクしたリスト全体を出力しなくて良いので効率的

5 ©︎ 2026 SB Intuitions Corp. 課題：既存手法における限界 • 既存手法は位置バイアスに対処できていないためリランキング対象リストの末尾に偏るような適合文書はより上位にあがりづらい
推論コストを増やさずに Fine-tuning で位置バイアスを除去できる手法が重要対処段階既存手法課題学習時 RankVicuna[2], RankZephyr[3] ランダムシャッフルによる位置バイアス軽減方法は性能低下につながる推論時 PermSC(PSC)[4], LLM-RankFusion[5] ランキングを複数出力するために推論回数が増えるため計算負荷が高い学習 + 推論 ListT5[6] ランキングの下位から上位へトーナメントでソート位置バイアス軽減はできたが計算負荷が高い [2] Pradeep et al., RankVicuna: Zero-shot listwise document reranking with open-source large language models, arXiv 2023. [3] Pradeep et al., RankZephyr: Effective and robust zero-shot listwise reranking is a breeze!, arXiv 2023. [4] Tang et al., Found in the middle: Permutation self-consistency improves listwise ranking in large language models, NAACL 2024. [5] Zeng et al., LLM-RankFusion: Mitigating intrinsic inconsistency in LLM-based ranking, NeurIPS 2024. [6] Yoon et al., ListT5: Listwise reranking with fusion-in-decoder improves zero-shot retrieval, ACL 2024.

6 ©︎ 2026 SB Intuitions Corp. 提案手法：DebiasFirst • LLM リランカーの仕組みに由来する構造的な問題と
モデルの fine-tuning における学習データの偏りに対処した手法の提案事前: ランキングにおける文書の順位傾向の測定学習: ランキングをシャッフルしてデータ拡張推論: ロジットを利用してリランキング

7 ©︎ 2026 SB Intuitions Corp. 手法の前提：First • 提案モデルは First[7]
という先行研究をベースとしている ◦ First の時点でランキングの各パッセージの識別子ロジットの利用方法を提案ランキング識別子のロジットの大小が真のランキングと一致させるためのペアワイズ損失言語モデルにおけるトークン予測の交差エントロピー損失 [7] Gangi Reddy et al., FIRST: Faster improved listwise reranking with single token decoding, EMNLP 2024.

8 ©︎ 2026 SB Intuitions Corp. 提案手法の詳細：First に逆傾向スコアで重み付け • Fisrt
の Rank 損失部分に IPS による重み付けを行っている ◦ 検索結果上位における単純な頻度ではなく入力位置から出力位置への遷移の非度に注目している（詳しくないだけかもですが遷移頻度はあまり見ない気がするので興味深いです逆傾向スコア (IPS) で重み付けして位置バイアスを軽減上位 20 件の単純な頻度ではなく入力→出力の遷移頻度を利用

9 ©︎ 2026 SB Intuitions Corp. 提案手法の詳細：傾向 ω 行列の集計 •
入力となる 1st Stage 検索モデルの検索結果上位 20 件の位置とリランカーの出力ランキングにおける位置の遷移頻度を利用 A B C D: 適合 E D: 適合 C B A E (4, 1) を +1 リランキングに対する入出力の遷移傾向の具体例クエリ 3,000 件分の各クエリにたいして First の上位 20 件を 10 通りシャッフルして 30,000 サンプルを作成

10 ©︎ 2026 SB Intuitions Corp. 提案手法の詳細：データ拡張によるバイアス対策 • 入出力位置の様々なパターンを学習することで特定の入出力位置パターンに対して過学習することへ対策
◦ position-aware augmentation, Pos-Aug ⚫ X軸: 入力位置 ⚫ Y軸: 正解のランキング位置（GPT-4 を利用している） ⚫ Z軸: x, y に該当するパッセージ数 ⚫ 入力位置と出力位置が一致しやすい傾向があり、この相関がバイアスとなっているという主張

11 ©︎ 2026 SB Intuitions Corp. RQ1：位置バイアスを減らせるか？ • 提案手法は適合文書がどの位置にあっても nDCG@10
が同程度 ◦ 既存手法は 5 位以下で nDCG@10 が低下傾向 ◦ 1~4 位では既存手法に劣るのでトレードオフな部分もあるといえる ⚫ データ: MS MARCO Dev ⚫ 検索モデル: Contriever（密検索） ⚫ 測定方法: 検索結果上位 20 件のうち適合パッセージの位置を 1〜20 まで 1 つずつずらして全パターンの nDCG@10 を測定

12 ©︎ 2026 SB Intuitions Corp. RQ2：複数データセットにおいて性能が出るか？ • ほとんどのデータセットにおいて提案手法によるリランキング結果が最も良い性能を示し、上位
20 件をシャッフルしても性能が保たれている ◦ リランキングはウィンドウサイズ 20、ステップサイズ 10 のスライディングウィンドウ方式で上位 100 件を並び替え入力となる検索結果の順序がオリジナルの場合、ほぼ全てのデータセットで提案手法が最も良い入力となる検索結果の順序をシャッフルした場合、既存手法は性能が落ちる傾向にあるが、提案手法は性能を保っている

13 ©︎ 2026 SB Intuitions Corp. RQ3：1st Stage の検索モデルを変えた時の性能は？ •
検索モデルを変えてもリランキングにおける検索性能は向上している ◦ RQ2 と同様にリランキングはウィンドウサイズ 20、ステップサイズ 10 のスライディングウィンドウ方式で上位 100 件を並び替え検索モデルを変えてもほぼ全てのデータセットでリランキング性能が出ている BM25 や Contriever ではより大きな性能改善につながっている

14 ©︎ 2026 SB Intuitions Corp. RQ4：推論ベースの手法を上回るか？ • 推論ベースの手法よりも提案手法による性能がより高いことがわかる ◦
推論時に位置バイアスに対処する手法 (PSC) と First を組み合わせた手法と比較しても提案手法がより高い性能が出ている ◦ 提案手法と PSC を組み合わせると若干ではあるが性能が向上提案手法と推論ベースの手法を組み合わせることで少ないシャッフル数で性能が向上する横軸は独立のシャッフル番号棒グラフは独立したスコアで折れ線グラフは PermSC がその番号までの結果を集約したスコア

15 ©︎ 2026 SB Intuitions Corp. どんな論文？ • LLM ベースの
Listwise Reranking 手法における位置バイアスを逆傾向スコアとデータ拡張によって除去する手法 DebiasFirst を紹介[1] [1] Qiao et al., LLM-based Listwise Reranking under the Effect of Positional Bias, ECIR 2026.

[IR Reading 2026春論文紹介] LLM-based Listwise Rera...

[IR Reading 2026春論文紹介] LLM-based Listwise Reranking under the Effect of Positional Bias (ECIR 2026) /IR-Reading-2026-Spring

Kohei Shinden PRO

More Decks by Kohei Shinden

Other Decks in Research

Featured

Transcript

[論文紹介] LLM-based Listwise Reranking under the Effect of Positional Bias

2 ©︎ 2026 SB Intuitions Corp. どんな論文？ • LLM ベースの

3 ©︎ 2026 SB Intuitions Corp. 背景：LLMベースリランカーとは？1/2 • 1st stage

4 ©︎ 2026 SB Intuitions Corp. 背景：LLMベースリランカーとは？2/2 • 1st stage

5 ©︎ 2026 SB Intuitions Corp. 課題：既存手法における限界 • 既存手法は位置バイアスに対処できていないためリランキング対象リストの末尾に偏るような適合文書はより上位にあがりづらい

6 ©︎ 2026 SB Intuitions Corp. 提案手法：DebiasFirst • LLM リランカーの仕組みに由来する構造的な問題と

7 ©︎ 2026 SB Intuitions Corp. 手法の前提：First • 提案モデルは First[7]

8 ©︎ 2026 SB Intuitions Corp. 提案手法の詳細：First に逆傾向スコアで重み付け • Fisrt

9 ©︎ 2026 SB Intuitions Corp. 提案手法の詳細：傾向 ω 行列の集計 •

10 ©︎ 2026 SB Intuitions Corp. 提案手法の詳細：データ拡張によるバイアス対策 • 入出力位置の様々なパターンを学習することで特定の入出力位置パターンに対して過学習することへ対策

11 ©︎ 2026 SB Intuitions Corp. RQ1：位置バイアスを減らせるか？ • 提案手法は適合文書がどの位置にあっても nDCG@10

12 ©︎ 2026 SB Intuitions Corp. RQ2：複数データセットにおいて性能が出るか？ • ほとんどのデータセットにおいて提案手法によるリランキング結果が最も良い性能を示し、上位

13 ©︎ 2026 SB Intuitions Corp. RQ3：1st Stage の検索モデルを変えた時の性能は？ •

14 ©︎ 2026 SB Intuitions Corp. RQ4：推論ベースの手法を上回るか？ • 推論ベースの手法よりも提案手法による性能がより高いことがわかる ◦

15 ©︎ 2026 SB Intuitions Corp. どんな論文？ • LLM ベースの

[IR Reading 2026春 論文紹介] LLM-based Listwise Rera...

[IR Reading 2026春 論文紹介] LLM-based Listwise Reranking under the Effect of Positional Bias (ECIR 2026) /IR-Reading-2026-Spring

More Decks by Kohei Shinden

Other Decks in Research

Featured

Transcript

[IR Reading 2026春論文紹介] LLM-based Listwise Rera...

[IR Reading 2026春論文紹介] LLM-based Listwise Reranking under the Effect of Positional Bias (ECIR 2026) /IR-Reading-2026-Spring