Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介:Diachronic_Sense_Modeling_with_Deep_Contex...

 文献紹介:Diachronic_Sense_Modeling_with_Deep_Contextualized_Word_Embeddings__An_Ecological_View.pdf

Taichi Aida

June 17, 2020
Tweet

More Decks by Taichi Aida

Other Decks in Research

Transcript

  1. Diachronic Sense Modeling with Deep Contextualized Word Embeddings: An Ecological

    View Renfen Hu, Shen Li, Shichen Liang ACL2019, pages 3899–3908 論文紹介
  2. 概要 - 文脈を考慮した言語モデルを用いて、1つの単語 に対して意味ごとに複数のベクトルを定義 - 3つの貢献 - 意味分類のタスクで 93.8% の精度

    - 単語の意味変化を捉えるタスクで先行研究を上回る - 単語の意味変化において、意味間の競争・協力を確認 2
  3. 導入 - 時間経過に伴う単語の意味の変化を検出する - apple → apple, - gay(気楽) →

    gay(同性愛者) - 先行研究:長期間のコーパスを分割し、時期ごと に単語分散表現を学習 - 前の時期の分散表現 W(t-1) で初期化する (Kim2014[1]) - 回転行列 R(t) を求めて alignment (Hamilton2016[2]) 3
  4. 導入 - 先行研究の問題点:1単語に1つのベクトル - 単語のどの意味が変化したのか? - 単語のどの意味は変化しないのか? - 文脈を考慮する言語モデル BERT

    - 同じ単語でも文脈が異なると違うベクトルになる → BERT を使って単語の意味ごとにベクトルを作成 4
  5. 調査対象の単語(対象語)の決定 - 調査対象のコーパス: Corpus of Historical American English (COHA) -

    期間:1810年~2009年 - 単語数:400M - コーパス内のジャンルはバランスが取れている - COHA において、以下の条件を満たす単語を意 味の変化を調べる対象語とした - 毎年10回以上出現 - 50年以上連続して出現 7
  6. 意味ごとにベクトルを定義 - 単語の意味ごとに Oxford dictionary から例文 を抽出 - 1つの意味について例文を最大10文抽出 -

    4881 語、15386 の意味 8 Oxford dictionary The mean score for this question... You’ll be satisfied with less food, which means you’ll... A mean in mathematics... This sign means that... 意味1(動詞):意味する 意味2(名詞):平均 例)対象語:mean
  7. 大規模データで分析 - BERT で対象語のベクトルを獲得 - 文中に出現する単語   がどの意味 に 属するか?

    - Oxford dictionary の例文から獲得した各意味ベクトルと の cos 類似度がもっとも高くなる意味に割り当てる - 対象語の各意味が出現する割合を調査 - 単語の意味ごとに時間経過による変化を調査することが 可能 11
  8. 実験:意味の分類タスク - 意味の分類タスク - 意味ごとのベクトルの作成に使用しなかった例文2000文 を Oxford dictionary から抽出 -

    それぞれの単語がどの意味に属するかを当てる - 評価:accuracy を計算 - 比較手法 - 提案手法(Baseline):抽出した例文に品詞を与えない - 提案手法(POSあり):抽出した例文に品詞を付与。定義し た意味には品詞が付与されているため、同じ品詞の意味 を選べば良いので簡単 12
  9. 実験:意味変化のスコア付け - Word Change Task - 意味変化の度合いをスコア付けするタスク - テストデータ -

    100語(名詞、動詞、形容詞)に意味変化の度合いが4段階でスコア付けさ れている - 0:全く変化していない, 3:著しく変化 - 比較時期:1960年代から見た1990年代における単語の意味変化 - 使われたコーパス:Google Books Ngram (COHA よりも大規模なデー タセット) - 評価 - Pearson の相関係数 - Spearman の順位相関係数 14
  10. 実験:意味変化のスコア付け - 意味変化スコアの計算(Lau2012[3]) - reference データ(COHA, 1960年代) と focus データ

    (COHA, 1990年代) の各意味の使用比率の比を算出 - 最大値を意味変化のスコアとして採用 15
  11. 実験:意味変化のスコア付け - 比較手法: - Local Mutual Information; LMI 行列を用いる。cos 類似

    度で意味変化スコアを算出(Gulordava2011[4]) - Topic Model を使用する(Frermann2016[5])。意味変化の スコアは提案手法と同じ Lau2012[3] の方法を採用。 16
  12. Conclusions - 文脈を考慮した言語モデル BERT で単語の意味 ごとにベクトルを獲得 - 意味分類のタスクで 93.8% の精度

    - 単語の意味変化をスコア付けするタスクで先行研 究を上回る - 単語の意味変化において、意味間の競争・協力 を確認 26
  13. Reference [1] Yoon Kim, Yi-I Chiu, Kentaro Hanaki, Darshan Hegde,

    Slav Petrov. Temporal Analysis of Language through Neural Language Models, Workshop on Language Technologies and Computational Social Science, 2014. [link] [2] William L. Hamilton, Jure Leskovec, Dan Jurafsky. Diachronic Word Embeddings Reveal Statistical Laws of Semantic Change, ACL2016. [link] [3] Jey Han Lau, Paul Cook, Diana McCarthy, David Newman, Timothy Baldwin. Word Sense Induction for Novel Sense Detection, EACL2012. [link] [4] Kristina Gulordava, Marco Baroni. A distributional similarity approach to the detection of semantic change in the Google Books Ngram corpus, GEMS2011. [link] [5] Lea Frermann, Mirella Lapata. A Bayesian Model of Diachronic Meaning Change, TACL2016. [link] 27