Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LT at nlp_career
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
yag_ays
July 10, 2019
Programming
350
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LT at nlp_career
yag_ays
July 10, 2019
More Decks by yag_ays
See All by yag_ays
対話型AIの構築における工夫とデータセットの重要性 - 素早くデータを構築し検証するためには
yag_ays
3
7.1k
目と耳を持った自然言語処理 - スタートアップにおける価値創出のために
yag_ays
1
3.9k
時間情報表現抽出とルールベース解析器のこれから / Temporal Expression Analysis in Japanese and Future of Rule-based Approach
yag_ays
1
2.3k
Pythonで始める ドキュメント・インテリジェンス入門 / Introduction to Document Intelligence with Python
yag_ays
9
9.2k
"医者の言葉、患者の言葉、エンジニアの言葉" / MNTSQ Ubie Vertical ai
yag_ays
3
14k
Review: "Recommending Investors for Crowdfunding Projects"
yag_ays
1
1.2k
Other Decks in Programming
See All in Programming
ローカルLLMを使ってB2Bサービスを作っていての学び
yaotti
0
180
ふつうのFeature Flag実践入門
irof
7
4k
キャリア迷子上等 ─ "ない道"は自分で作ればいい
16bitidol
3
2.1k
コンテキストの使い捨てをやめる — ビジネスルール駆動開発と miko —
ioki
0
210
DynamoDBには集計系のクエリがないけどなんとかしたい
musan
1
140
Creating Composable Callables in Contemporary C++
rollbear
0
140
Vite+ Unified Toolchain for the Web
naokihaba
0
310
さぁV100、メモリをお食べ・・・
nilpe
0
140
Dataformのリポジトリを立ち上げるときにまずやること / dataform-day0-2026
snhryt
0
160
Make SRE Operations Easier with Azure SRE Agent
kkamegawa
0
6.4k
Oxcを導入して開発体験が向上した話
yug1224
4
320
PHPで使える日時の表現と、その知り方 #frontend_phpcon_do
o0h
PRO
0
250
Featured
See All Featured
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
250
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
1
350
Claude Code のすすめ
schroneko
67
230k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.5k
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
140
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
A Modern Web Designer's Workflow
chriscoyier
698
190k
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Paper Plane
katiecoart
PRO
1
51k
Automating Front-end Workflow
addyosmani
1370
210k
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
1
540
Transcript
1 yag_ays Machine Learning Engineer @Sansan, Inc. ! NLP研究室出⾝ (Bioinformatics)
! 博⼠号
2 https://yag-ays.github.io/
pytorchでBERTの⽇本語学習済みモデルを利⽤する - ⽂章埋め込み 編 / SWEM: 単語埋め込みのみを使うシンプルな⽂章埋め込み深層 学習時代の⾔語判定の最新動向 / Fasttextを⽤いた⾔語判定
/ MeCabの形態素解析の結果から正規表現を使って品詞列を抜き出 すmecabpr / 単語埋め込みにおけるout-of-vocabularyの対応 - magnitudeの初期化」 / 後処理のみで単語ベクトルの性能を向上さ せるALL-BUT-THE-TOPを使った⽇本語学習済み分散表現 / 語彙 を限定して単語ベクトルのモデルサイズを⼩さくするminify_w2v / ⽇本語Wikipediaで学習したdoc2vecモデル / Wikipediaの記事ごと のページビューを取得する / Word Embedding based Edit Distanceの実装 / 学習済み分散表現をTensorBoardで可視化する (gensim/PyTorch/tensorboardX) / Unicode絵⽂字の⽇本語読み /キーワード/分類辞書 / 漢字を構成する部⾸/偏旁のデータセッ ト / Wikipedia CirrusSearchのダンプデータを利⽤する / ⽂字の図 3
もっと⽇本語が使える 論⽂実装をしてくれ、頼む! 4
英語を対象にした英語の論⽂が出る 英語を対象にした実装が公開される ⽇本語で書かれた論⽂解説が出る ⽇本語を対象にした実装が出る 5
論⽂解説してる⼈ → 実装してくれ! 実装してる⼈ → 公開してくれ! 6 ググって出てこなくても、Githubで論⽂名やロジック名で 検索すると意外と出てくる場合もある
良いこと 1. 動く!使える!試せる! プロダクト作るでしょ?実験するでしょ? 2. フィードバック貰える 意⾒を貰える、間違っていれば指摘してくれる (場合もある) 3 ⼈のためになる
⽇本語という⼩さい⾔語の中で⾞輪の再発明してる場合じゃねぇ 4. 転職に有利 それがあなたのポートフォリオになる(コードを書けるかはものすごい⼤事) 7
悪いこと 1. ない 8
まとめ 9 yag_aysです。ブログやってます ⽇本語使える実装しよう NLPエンジニアコミュニティを盛 り上げていきましょう