Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ゼロつく2 輪読会 3.1-3.3
Search
keitaro2002
February 21, 2024
Technology
40
0
Share
ゼロつく2 輪読会 3.1-3.3
keitaro2002
February 21, 2024
More Decks by keitaro2002
See All by keitaro2002
ゼロつく2 輪読会 3.4-3.6
keitaro2002
0
56
Other Decks in Technology
See All in Technology
"SQLは書けません"から始まる データドリブン
kubell_hr
2
460
Digitization部 紹介資料
sansan33
PRO
1
7.3k
[最強DB講義]推薦システム | 基礎編
recsyslab
PRO
1
140
Azure PortalなどにみるWebアクセシビリティ
tomokusaba
0
370
ぼくがかんがえたさいきょうのあうとぷっと
yama3133
0
170
Sansan Engineering Unit 紹介資料
sansan33
PRO
1
4.2k
扱える不確実性を増やしていく - スタートアップEMが考える「任せ方」
kadoppe
0
250
目的ファーストのハーネス設計 ~ハーネスの変更容易性を高めるための優先順位~
gotalab555
7
1.9k
Code Interpreter で、AIに安全に コードを書かせる。
yokomachi
0
6.9k
AIエージェントの権限管理 2: データ基盤の Fine grained access control 編
ren8k
0
120
QGISプラグイン CMChangeDetector
naokimuroki
1
340
60分で学ぶ最新Webフロントエンド
mizdra
PRO
33
18k
Featured
See All Featured
Measuring & Analyzing Core Web Vitals
bluesmoon
9
810
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
1.9k
Mobile First: as difficult as doing things right
swwweet
225
10k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
1k
Ethics towards AI in product and experience design
skipperchong
2
250
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
27
3.4k
KATA
mclloyd
PRO
35
15k
The Cult of Friendly URLs
andyhume
79
6.8k
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
1
490
WCS-LA-2024
lcolladotor
0
530
Unsuck your backbone
ammeep
672
58k
The Limits of Empathy - UXLibs8
cassininazir
1
300
Transcript
ゼロつく2 輪読会 Part3 3.1~3.3 2024年 2⽉22⽇
‣ これ以降の図は以下より引⽤ 斎藤 康毅 「ゼロから作るDeep Learning ❷―⾃然⾔語処理編」 はじめに
‣ 前回の復習 ‣ カウントベースから推論ベースへ ‣ word2vec ‣ 次回に向けて ⽬次
前回の復習
‣ コサイン類似度→(⾃⼰)相互情報量 PMI ‣ 値が⼤きいほど共起(⼀緒に出現)しやすい ‣ SVD(特異値分解)による次元削減 前回の復習
カウントベースから推論ベー スへ
‣ ⼤規模なコーパスを扱いきれない. ‣ SVDまで⾏うと𝑂(𝑛!)の計算コストがかかる. ‣ 学習時に全てのデータを⽤いて1回の処理で分散表現を 獲得 カウントベースの問題点
‣ 推論ベース ‣ ミニバッチで学習 推論ベースの登場
‣ 周囲の単語から「?」に⼊る単語を推測する. ‣ 単語の出現確率を学習 推論ベースの概要
‣ one-hotベクトル 単語の処理
word2vec
‣ word2vecで提案されているモデルの1つ ‣ コンテキストからターゲットを推測するNN (学習の詳細は次回) CBOW(countinuous bag-of-word)
モデルの具体例 コンテキストとしてN個の単語 →⼊⼒層はN個 CrossEntropyLoss
‣ 3つの選択肢 1. ⼊⼒側の重み(𝑊"# )だけ 2. 出⼒側の重み(𝑊$%& )だけ 3. 2つの重みを両⽅
‣ 1.⼊⼒側の重みだけが最もポピュラー 単語の分散表現
次回に向けて
‣ 使⽤するコーパス ‣ 「You say goodbye and I say hello.」
学習データの準備
コンテキストとターゲット
ベクトルに変換
one-hotベクトル