Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介:WhitenedCSE: Whitening-based Contrastive L...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Taichi Aida
October 27, 2023
Research
390
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
文献紹介:WhitenedCSE: Whitening-based Contrastive Learning of Sentence Embeddings
https://aclanthology.org/2023.acl-long.677/
Taichi Aida
October 27, 2023
More Decks by Taichi Aida
See All by Taichi Aida
意味を表すベクトル表現を用いたテキスト分析
a1da4
0
130
スウェーデン滞在報告
a1da4
0
31
PhD Defence: Considering Temporal and Contextual Information for Lexical Semantic Change Detection
a1da4
1
300
文献紹介:A Multidimensional Framework for Evaluating Lexical Semantic Change with Social Science Applications
a1da4
1
400
YANS2024:目指せ国際会議!「ネットワーキングの極意(国際会議編)」
a1da4
0
330
言語処理学会30周年記念事業留学支援交流会@YANS2024:「学生のための短期留学」
a1da4
1
450
新入生向けチュートリアル:文献のサーベイv2
a1da4
18
12k
文献紹介:Isotropic Representation Can Improve Zero-Shot Cross-Lingual Transfer on Multilingual Language Models
a1da4
0
240
文献紹介:On the Transformation of Latent Space in Fine-Tuned NLP Models
a1da4
0
140
Other Decks in Research
See All in Research
ローテーション別のサイドアウト戦略 ~なぜあのローテは回らないのか?~
vball_panda
0
340
はじまりの クエスチョンブック —余暇と豊かさにあふれた社会とは?
culturaltransition
PRO
0
510
AIエージェント時代のLLM-jpモデルのあるべき姿
k141303
0
440
Scalable dynamic origin-destination demand estimation enhanced by high-resolution satellite imagery data
satai
3
250
NLP colloquium: AI Safety Survey
kanekomasahiro
0
540
適応的スパムフィルタのための軽量な類似メッセージカウンタ / jsai2026-adaptive-spam-filter
monochromegane
0
1.4k
ScoreMatchingRiesz for Automatic Debiased Machine Learning and Policy Path Estimation with an Application to Japanese Monetary Policy Evaluation
masakat0
0
290
オーストリア流 都市の公共交通サービス水準評価@公共交通オープンデータ最前線2026
trafficbrain
0
180
CyberAgent AI Lab研修 / Social Implementation Anti-Patterns in AI Lab
chck
7
4.6k
SoftMatcha 2: 1兆語規模コーパスの超高速かつ柔らかい検索
e869120_sub
6
3.4k
[BlackHatAsia2026] Hidden Telemetry: Uncovering TraceLogging ETW Providers You're Not Using (Yet)
asuna_jp
1
500
AGI4OPT:自然言語から数理最適化を導くエ ージェントスキル Translating Human Intent into Mathematical Optimization
mickey_kubo
0
130
Featured
See All Featured
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Art, The Web, and Tiny UX
lynnandtonic
304
22k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
150
Large-scale JavaScript Application Architecture
addyosmani
515
110k
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
200
Paper Plane
katiecoart
PRO
1
51k
Code Reviewing Like a Champion
maltzj
528
40k
The Pragmatic Product Professional
lauravandoore
37
7.3k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
190
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
200
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.7k
How to make the Groovebox
asonas
2
2.2k
Transcript
論文紹介 WhitenedCSE: Whitening-based Contrastive Learning of Sentence Embeddings Wenjie Zhuo,
Yifan Sun, Xiaohan Wang, Linchao Zhu, Yi Yang ACL2023
概要 - 対照学習を採用した SimCSE は文埋め込み学習の代表的な 手法であり、下記の操作で文埋め込みの学習を行うが、負例 間には操作が行われない - 正例と近づける(alignment) -
負例から離す(uniform) - 埋め込み空間上の全てのデータを uniform にする白色化を 導入(WhitenedCSE) - タスクの性能を向上 - alignment, uniform を改善 2
単語埋め込みの分布 - 理想:単語埋め込みは一様に分布(uniform)🤩 - 現実:単語埋め込みは歪んでいる😫 [Mu+18] - 頻度が揃っていないから? - 後処理で歪みをとると性能向上
- all-but-the-top [Mu+18]、白色化、方向白色化 [横井ら21] など 3
文埋め込みの分布 - 文埋め込みはどう…?→歪んでる😫 [Yan+21] - 単語埋め込みと同様に、後処理で歪みをとると性能向上 - 色々な後処理を試し、性能向上 [Sajjad+22] -
ガウス潜在空間上に変換する [Li+20] 4
対照学習の効果 - SimCSE [Gao+21] で採用されている対照学習 (b) は、 正例に近づけて alignment (似たものを近く配置)し、
負例から離す際に(部分的に) uniform な空間を得る - 負例間では行われないのが重要 - 一方、白色化 (c) は空間全てのベクトルを uniform にする - 対照学習 (b) は部分的な白色化 (c)? - (b) は (a) と (c) の中間のようだが… 5
提案:WhitenedCSE - SimCSE と白色化を組み合わせることで、対照学習の「負例 同士に適用できない」問題を解決できないか? 6 Uniform (一様に分布しているか) Alignment (似たものが近くにあるか)
SimCSE △ (負例を離す時のみ) ✅ 白色化 ✅ ❌ SimCSE+白色化 (提案) ✅? ✅?
提案:WhitenedCSE 7
提案:WhitenedCSE - 得られたベクトルを白色化する - Group Whitening - 次元を k 分割して白色化→統合
- Shuffled Group Whitening(提案) - シャッフルしてから Group Whitening - 複数回行うとデータ拡張にもなる 8
提案:WhitenedCSE - 白色化した文ベクトルを使い、対照学習 - 従来の Contrastive Loss は正例が1つ - 今回は正例が複数なので
Multi-Positive Contrastive Loss を提案 9
実験 - 実際、性能はどうなのか? - 2種類のタスクで実験 - 類似度タスク:文ベクトルから文類似度を予測 - 転移タスク:文ベクトルでロジスティック回帰の分類器を学習 10
実験:類似度タスク - 実際、性能はどうなのか?→結構良かった - ほとんどのタスクで先行研究の性能を上回る 11
実験:転移タスク - 実際、性能はどうなのか?→多少(?)良かった - 様々な転移タスクでの平均性能を上回る 12
分析:Ablation - 普通の白色化ではどうか?→ダメらしい - PCA→ZCAでもかなり違う - (Shuffled)Group-Whitening が良い 13
分析:Ablation - 正例を増やすだけではどうか?→ダメらしい - ここでも Shuffled Group-Whitening が良い 14
分析:Uniform, Alignment - 冒頭でこんな表を出したが…本当に改善してる? - Uniform, Alignmentを測る損失 [Wang+20] で評価 15
分析:Uniform, Alignment - 冒頭でこんな表を出したが…本当に改善してる! 16
まとめ - 対照学習を採用した SimCSE は文埋め込み学習の代表的な 手法であり、下記の操作で文埋め込みの学習を行うが、負例 間には操作が行われない - 正例と近づける(alignment) -
負例から離す(uniform) - 埋め込み空間上の全てのデータを uniform にする白色化を 導入(WhitenedCSE) - タスクの性能を向上 - alignment, uniform を改善 - 白色化である必要性? - 通常の白色化 << グループにわけて白色化(Group Whitening) - 白色化以外の後処理手法を試すこともできるはず - ガウス潜在空間上に変換する手法 [Li+20] など 17
参考文献 [Mu+18] Jiaqi Mu, Pramod Viswanath. “All-but-the-Top: Simple and Effective
Postprocessing for Word Representations”, ICLR2018 [横井ら21] 横井祥, 下平英寿. “単語埋め込みの確率的等方化 ”, NLP2021 [Yan+21] Yuanmeng Yan, Rumei Li, Sirui Wang, Fuzheng Zhang, Wei Wu, Weiran Xu. “ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer”, ACL-IJCNLP2021 [Sajjad+22] Hassan Sajjad, Firoj Alam, Fahim Dalvi, Nadir Durrani. “Effect of Post-processing on Contextualized Word Representations”, COLING2022 [Li+20] Bohan Li, Hao Zhou, Junxian He, Mingxuan Wang, Yiming Yang, Lei Li. “On the Sentence Embeddings from Pre-trained Language Models”, EMNLP2020 [Gao+21] Tianyu Gao, Xingcheng Yao, Danqi Chen. “SimCSE: Simple Contrastive Learning of Sentence Embeddings”, EMNLP2021 [Wang+20] Tongzhou Wang, Phillip Isola. “Understanding Contrastive Representation Learning through Alignment and Uniformity on the Hypersphere”, ICML2020 18