Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

【輪講資料】Decoding Dense Embeddings: Sparse Autoenc...

Avatar for Yano Yano
December 01, 2025
58

【輪講資料】Decoding Dense Embeddings: Sparse Autoencoders for Interpreting and Discretizing Dense Retrieval

研究室の輪講で利用した資料です。
論文リンク:https://aclanthology.org/2025.emnlp-main.1345/

Avatar for Yano

Yano

December 01, 2025
Tweet

Transcript

  1. Decoding Dense Embeddings: Sparse Autoencoders for Interpreting and Discretizing Dense

    Retrieval 12݄2೔ ࡫໺ݚڀࣨɹD1 ໼໺ઍߛ Seongwan Park, Taeklim Kim, Youngjoong Ko EMNLP 2025
  2. ಋೖɿDence Passage Retrieval • BERTͳͲͷ૒ํ޲ϞσϧΛར༻ͯ֫͠ಘͨ͠ΫΤϦͱจॻͷຒΊࠐΈ ͷྨࣅ౓ʹΑͬͯจॻݕࡧΛߦ͏ख๏ • TF-IDF΍BM25ͳͲͷૄͳख๏ͱҧ͍ɺ୯ޠද૚͕׬શʹҰக͍ͯ͠ͳ ͯ͘΋ݕࡧͰ͖Δ 4

    ߴྨࣅ౓ ௿ྨࣅ౓ ೔ຊͰҰ൪ߴ͍ࢁ͸ʁ ෋࢜ࢁʢ;͡͞Μʣ͸ɺ
 ೔ຊͷ׆ՐࢁͰ͋Δ… ৴ೱ઒ʢ͠ͳͷ͕Θʣ͸ɺ ৽ׁݝ͓Αͼ௕໺ݝΛ… Ϟσϧ Ϟσϧ Ϟσϧ
  3. DPRղऍʹ༻͍ΔSAE • ຊ࿦จͰ͸DPRͷग़ྗʹSAEΛద༻͠ɺݕࡧʹར༻͢Δಛ௃ʹͭ ͍ͯղऍΛࢼΈΔ • 7 4"&΁ͷೖྗʢ%13ͷग़ྗʣ 4QBSTF-BUFOUT  ΤϯίʔμͷॏΈͱόΠΞε߲

     σίʔμͷॏΈͱόΠΞε߲ Ћ׆ੑԽؔ਺͜͜Ͱ͸#BUDI5PQ,Λར༻ h ∈ ℝd z ∈ ℝm(m > > d) Wenc ∈ ℝm*d benc ∈ ℝm Wden ∈ ℝd*m bdec ∈ ℝd SAEͷ಺෦දݱʢSparse LatentsʣΛ
 ૄʹ͢ΔͨΊͷ੍໿Ͱɺόον͝ͱʹ
 top kΑΓԼҐͷ஋Λ͢΂ͯ0ʹ͢Δؔ਺ ˛˞ม਺͸Ұக͍ͯ͠ͳ͍͕ɺΠϝʔδ
  4. SAEͷ܇࿅ઃఆ • ର৅Ϟσϧ: SimML • ର৅σʔληοτ: MS-MARCOͷ܇࿅ηοτ • 8.8Mͷจॻͱ0.5MͷΫΤϦ •

    SAEͰͷ࣍ݩͷ֦େ཰ʢm/dʣ: 32 • BatchTopKͷk: 32, 48, 64, 128 • ͻͱͭͷຒΊࠐΈΛදݱ͢ΔͨΊʹར༻Մೳͳ࣍ݩ਺ • ࣮ࡍʹ͸όον͝ͱʹbs x k࣍ݩ 8 SimLM E࣍ݩ N࣍ݩ E࣍ݩ ʜ 4"& &OD 4"& %FD ޡ͕ࠩখ͘͞ͳΔ Α͏ʹ܇࿅
  5. SAEͷධՁ1: ࠶ߏஙͨ͠ϕΫτϧͷ඼࣭ • NMSE: DPRͷຒΊࠐΈͱ࠶ߏஙͨ͠ϕΫτϧͷޡࠩ • ฏۉతͳ׆ੑԽ஋Λ༧ଌͨ͠৔߹ͷޡࠩͰׂͬͨ΋ͷ • MRR, Recall,

    NDCG: ࠶ߏஙͨ͠ϕΫτϧʹΑΔݕࡧਫ਼౓ • Spearman: DPRͷຒΊࠐΈͱ࠶ߏஙͨ͠ϕΫτϧͷ૬ؔ܎਺ • ୯७ͳݕࡧΑΓ΋ৄࡉͳRerankingೳྗΛ͸͔Δ 9
  6. SAEͷධՁ1: ࠶ߏஙͨ͠ϕΫτϧͷ඼࣭ • NMSE: DPRͷຒΊࠐΈͱ࠶ߏஙͨ͠ϕΫτϧͷޡࠩ • ฏۉతͳ׆ੑԽ஋Λ༧ଌͨ͠৔߹ͷޡࠩͰׂͬͨ΋ͷ • MRR, Recall,

    NDCG: ࠶ߏஙͨ͠ϕΫτϧʹΑΔݕࡧਫ਼౓ • Spearman: DPRͷຒΊࠐΈͱ࠶ߏஙͨ͠ϕΫτϧͷ૬ؔ܎਺ • ୯७ͳݕࡧΑΓ΋ৄࡉͳRerankingೳྗΛ͸͔Δ 10 K͸େ͖ͨ͘͠ํ͕࠶ߏஙͷޡࠩ͸Լ͕Γɺ ݕࡧͷੑೳ΋্͕Δ
  7. જࡏม਺ͷઆ໌͔Βਓؒ͸ϞσϧΛղऍͰ͖Δ͔ʁ • จॻ༧ଌɿજࡏม਺ͷઆ໌܈ʹΑͬͯɺਓ͕ؒจॻ܈ʢ10݅ʣ͔Βର৅ͷจ ॻʢ1݅ʣΛಛఆͰ͖Δ͔࣮ݧ • MS MARCO͔Β600݅ • ϦϥϯΩϯάɿΫΤϦͱީิจॻͷજࡏม਺ͷઆ໌܈ʹΑͬͯɺਓ͕ؒϞσ ϧͱಉ༷ͷॱҐ෇͚ΛͰ͖Δ͔࣮ݧ

    • 2ͭͷจॻͷ͏ͪɺͲͪΒ͕ߴॱҐ͔Λબ୒ɻจॻϖΞ͸ҎԼͷ3ઃఆɿ • Retrieved Positive vs Retrieved Positive • Retrieved Positive vs Not Retrieved Positive • Retrieved Negative vs Not Retrieved Positive • TREC 2019ͱTREC 2020ͷσʔλΛར༻͠ɺTop 1000จॻΛRetrievedͱఆٛ 13
  8. Concept-Level Sparse RetrievalͷఏҊ • ͜͜·Ͱͷํ๏Λ֦ு͠ɺજࡏม਺Λ࢖ͬͨݕࡧख๏ΛఏҊ͢Δ • ΫΤϦͱจॻͷؒͷݕࡧείΞ͸ҎԼͰఆٛ • BM25ͷܭࢉࣜΛϕʔεʹิਖ਼Λಋೖ •

    ݕࡧ͸స஍ΠϯσοΫεΛར༻͢Δ͜ͱͰߴ଎ • ࣄલʹจॻΛΤϯίʔυ -> જࡏม਺͕keyͱͳΔసஔΠϯσοΫεΛ ࡞੒ 16 ΫΤϦRʹ͓͚Δજࡏม਺JͷॏΈ จॻEʹ͓͚Δજࡏม਺JͷॏΈ *%'ʹΑΔJ΁ͷॏΈ fq (q, i) fd (d, i) JEG(i) R
  9. Concept-Level Sparse RetrievalͷఏҊ • ͜͜·Ͱͷํ๏Λ֦ு͠ɺજࡏม਺Λ࢖ͬͨݕࡧख๏ΛఏҊ͢Δ • ΫΤϦͱจॻͷؒͷݕࡧείΞ͸ҎԼͰఆٛ • BM25ͷܭࢉࣜΛϕʔεʹิਖ਼Λಋೖ •

    ݕࡧ͸స஍ΠϯσοΫεΛར༻͢Δ͜ͱͰߴ଎ • ࣄલʹจॻΛΤϯίʔυ -> જࡏม਺͕keyͱͳΔసஔΠϯσοΫεΛ ࡞੒ 17 ΫΤϦRʹ͓͚Δજࡏม਺JͷॏΈ จॻEʹ͓͚Δજࡏม਺JͷॏΈ *%'ʹΑΔJ΁ͷॏΈ fq (q, i) fd (d, i) JEG(i) R ݕࡧ෦෼͸ߴ଎͕ͩɺݕࡧ࣌ʹ΋ΫΤϦΛ DPRͰΤϯίʔυ͢Δඞཁ͕͋Δ
  10. ൺֱख๏ • Sparse Retrieval: ୯ޠͷ౷ܭ৘ใΛݩʹͨ͠ߴ଎ͳख๏ • BM25: จॻதͷ୯ޠස౓ʹجͮ͘ख๏ • RM3:

    ্ҐจॻΛར༻ͯ͠ΫΤϦ֦ுΛߦ͏BM25ͷޙଓख๏ • docT5query: T5ʹΑͬͯจॻ͔Β૝ఆ࣭໰Λ࡞੒͠BM25Λߦ͏ • Neural Sparse Retrieval: ਪ࿦࣌ʹχϡʔϥϧωοτΛ૊Έ߹Θͤͨख๏ • query2doc: LLMͰΫΤϦ͔ΒจॻΛੜ੒͠ΫΤϦʹ௥Ճ • DeepImpact: ୯ޠͷॏཁੑͱͯ͠ग़ݱճ਺Ͱ͸ͳ͘BERTͷ༧ଌ஋Λ࢖͏ • uniCOIL: BERTʹΑΔຒΊࠐΈΛ1࣍ݩʹѹॖ͠స஍ΠϯσοΫεΛ࢖͏ • SPLADE: BERTΛ࢖ͬͯจॻʹؚ·ΕΔ୯ޠͷॏΈ͚ͮͱؔ࿈ޠͷ௥ՃΛߦ͏ 18
  11. ܭࢉޮ཰ΛଌΔࢦඪ • FLOPs: ΫΤϦͱจॻϖΞ͝ͱͷԋࢉ਺ͷظ଴஋ • D Len: จॻ͝ͱͷฏۉಛ௃ྔ਺ • CL-SRͰ͸જࡏม਺ͷ਺ɻBM25Ͱ͸୯ޠ਺ɺSPLADEͰ͸୯ޠ+

    ؔ࿈ޠ਺ • Vocab Size: ΠϯσοΫε͞Ε͍ͯΔIDͷେ͖͞ • CL-SRͰ͸ར༻͞ΕΔજࡏม਺ͷ਺ɻBM25Ͱ͸ར༻͞ΕΔτʔΫ ϯͷछྨɺSPLADEͰ͸ར༻͞ΕΔϞσϧͷvocab size… 19