Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
How to start studying NLP 02
Search
kabayan55
February 18, 2019
Programming
7
5.3k
How to start studying NLP 02
kabayan55
February 18, 2019
Tweet
Share
More Decks by kabayan55
See All by kabayan55
My favorite tool 2019
kabayan55
2
1.7k
Escalators are Awesome
kabayan55
2
1.5k
How to start studying NLP
kabayan55
0
350
Other Decks in Programming
See All in Programming
AIの誤りが許されない業務システムにおいて“信頼されるAI” を目指す / building-trusted-ai-systems
yuya4
7
4.3k
LLMで複雑な検索条件アセットから脱却する!! 生成的検索インタフェースの設計論
po3rin
4
1.1k
QAフローを最適化し、品質水準を満たしながらリリースまでの期間を最短化する #RSGT2026
shibayu36
0
1.8k
フルサイクルエンジニアリングをAI Agentで全自動化したい 〜構想と現在地〜
kamina_zzz
0
350
【卒業研究】会話ログ分析によるユーザーごとの関心に応じた話題提案手法
momok47
0
170
疑似コードによるプロンプト記述、どのくらい正確に実行される?
kokuyouwind
0
140
Deno Tunnel を使ってみた話
kamekyame
0
310
AI 駆動開発ライフサイクル(AI-DLC):ソフトウェアエンジニアリングの再構築 / AI-DLC Introduction
kanamasa
11
5.2k
0→1 フロントエンド開発 Tips🚀 #レバテックMeetup
bengo4com
0
480
PC-6001でPSG曲を鳴らすまでを全部NetBSD上の Makefile に押し込んでみた / osc2025hiroshima
tsutsui
0
200
Unicodeどうしてる? PHPから見たUnicode対応と他言語での対応についてのお伺い
youkidearitai
PRO
0
420
LLM Çağında Backend Olmak: 10 Milyon Prompt'u Milisaniyede Sorgulamak
selcukusta
0
150
Featured
See All Featured
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.3k
Faster Mobile Websites
deanohume
310
31k
Test your architecture with Archunit
thirion
1
2.1k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
130
Abbi's Birthday
coloredviolet
0
4.2k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.4k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
110
Exploring anti-patterns in Rails
aemeredith
2
220
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.5k
GitHub's CSS Performance
jonrohan
1032
470k
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
77
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
540
Transcript
ʲॳ৺ऀ͚ʳ ɹ͡ΊͯΈΑ͏ʂࣗવݴޠॲཧ ɹɹࣗવݴޠॲཧͷੈքɺΑ͏ͦ͜ αϙʔλʔζ$P-BCษڧձ ݄ LBCBZBO
LBCBZBO େֶɾେֶӃͷݚڀͰࣗવݴޠॲཧ 8FCܥاۀ৽ଔ σʔλαΠΤϯεΤϯδχΞ ࣗݾհ
Agenda ࣗવݴޠॲཧͰͰ͖Δ͜ͱ ࣗવݴޠॲཧͷษڧ๏
Agenda ࣗવݴޠॲཧͰͰ͖Δ͜ͱ ࣗવݴޠॲཧͷษڧ๏
ࣗવݴޠΛίϯϐϡʔλͰॲཧ͢Δ ࣗવݴޠɿਓ͕ؒৗతʹͬͯΔݴޠ ɹɹɹɹɹྫ ຊޠɺӳޠ ੜ·Εͨͱ͖͔Βۙʹ͋ΔࣗવݴޠΛ ίϯϐϡʔλͰॲཧͰ͖Δͬͯ ͳΜ͔ͩͦ͢͝͏ʂ ʜʜͱ࠷ॳࢲࢥ͍·ͨ͠ ࣗવݴޠॲཧͬͯͳʹʁ
֓ཁਤ ⽂書分類 ⾃動要約 情報抽出 機械翻訳 質問応答 情報検索 評判分析 形態素解析 構⽂解析
意味解析 要素技術 複合技術 etc.
ܗଶૉղੳ ܗଶૉʢ୯ޠʣʹ͚ͯࢺผ .F$BC +6."/ͳͲ $ mecab すもももももももものうち すもも 名詞,⼀般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,⼀般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,⼀般,*,*,*,*,もも,モモ,モモ の 助詞,連体化,*,*,*,*,の,ノ,ノ うち名詞,⾮⾃⽴,副詞可能,*,*,*,うち,ウチ,ウチ EOS ཁૉٕज़
ߏจղੳ ,/1 $BCP$IB ͳͲ ཁૉٕज़ Wikipedia より
ҙຯղੳ ߏจతᐆດੑ͕͋Δͱ͖ ҙຯղੳ͕ඞཁ ྫ ʮ಄͕͍ڕΛ৯Δೣʯ தଜ໌༟͞Μ !OLNS@BLJ ͷ5XJUUFSΑΓ ཁૉٕज़
จॻྨ จॻΛΧςΰϦ͝ͱʹ͚Δ ࣗಈཁ จষΛࣗಈͰཁ͢Δ ใநग़ ΩʔϫʔυΛநग़͢Δ ྫʣΠϕϯτใநग़ɺใநग़ ෳ߹ٕज़
ෳ߹ٕज़ ධੳ ྫ ϨϏϡʔจ Positive Negative ͜ͷέʔΩ͍ͪ͝ͷ ͕͞ࡍཱͬͯඒຯͰͨ͠ɻ ·ͨߪೖ͍ͨ͠Ͱ͢ɻ ΫϦʔϜ͕͗ͨ͢ɻ
εϙϯδ͕ύαύαͩͬͨɻ
ෳ߹ٕज़ ػց༁ ใݕࡧ ࣭Ԡ
୯ޠΛϕΫτϧͰදݱͰ͖Δ ୯ޠͷ͠ࢉҾ͖ࢉ͕Ͱ͖Δ ྫ LJOHrNBO XPNBORVFFO ୯ޠͷྨࣅ͕Θ͔Δ χϡʔϥϧωοτϫʔΫ ٕज़հ8PSE7FD King Queen
Woman Man
8PSE7FDͱͷҧ͍ɿ׆༻ܗΛ·ͱΊΒΕΔ ྫ HP HPJOH HPFTˠHP ٕज़հGBTU5FYU
݄ʹ(PPHMF͕ެ։ ൚༻తͳϞσϧ ϑΝΠϯνϡʔχϯάͰߴ͍ਫ਼Λग़͢ ٕज़հ#&35
Agenda ࣗવݴޠॲཧͰͰ͖Δ͜ͱ ࣗવݴޠॲཧͷษڧ๏
ࢲPythonΛ༻͍ͯ͠·͢ Python͕ਓؾʂ ϝϦοτ ! εΫϦϓτݴޠͳͷͰ͙͢ʹ࣮ߦͰ͖Δ ! ๛ͳϥΠϒϥϦ ɹ/VNQZ 4DJQZ /-5, 4DJLJUMFBSO ϓϩάϥϛϯάݴޠʁ
͓͢͢Ίڭࡐ
ݴޠॲཧຊϊοΫ http://www.cl.ecei.tohoku.ac.jp/nlp100/
ݴޠॲཧຊϊοΫ ! ౦େͷԬ࡚ઌੜ͕࡞ͨ͠ νϡʔτϦΞϧ ! Pythonͷ࿅शʹͳΔ ! ݴޠॲཧʹඞཁͳ࣮͜͜ͰֶΔ ! GitHubʹίʔυΛ্͛ͯΔͻͱଟ͘ɺ ଞͷਓͷίʔυΛࢀߟʹͰ͖ΔͷͰ ಠֶ͍͢͠
ݴޠॲཧຊϊοΫ
ݴޠॲཧຊϊοΫ GitHubͰ “NLP100knock” ͱ ݕࡧ͢Δ͚ͩͰɺ 86 ϦϙδτϦ ݟ͔ͭΔ ˞20189݄࣌
ར༻ऀͨ͘͞Μ ͍·͢
/-1ϓϩάϥϛϯάνϡʔτϦΞϧ http://phontron.com/teaching.php
/-1ϓϩάϥϛϯάνϡʔτϦΞϧ http://phontron.com/teaching.php
/-1ϓϩάϥϛϯάνϡʔτϦΞϧ ! ΧʔωΪʔϝϩϯେֶͷ Graham Neubig ઌੜ͕࡞ͨ͠ νϡʔτϦΞϧ ! εϥΠυܗࣜ ! ֤νϡʔτϦΞϧʹԋश͕͋Γɺ ٖࣅίʔυͱߨٛεϥΠυΛࢀߟʹ ࣮͢Δͱཧղ͕ਂ·Δ
! ࣜΑΓίʔυΛݟͨ΄͏͕ ཧղ͍͢͠ਓʹಛʹΦεεϝ
/-1ϓϩάϥϛϯάνϡʔτϦΞϧ ࢿྉɾԋशσʔλ ͔͜͜Β Ұׅμϯϩʔυʂ https://github.com/neubig/nlptutorial
ࣗવݴޠॲཧΛಠश͍ͨ͠ਓͷͨΊʹ http://cl.sd.tmu.ac.jp/prospective/prerequisite
ࣗવݴޠॲཧΛಠश͍ͨ͠ਓͷͨΊʹ टେֶ౦ژͷখொઌੜ͕ ! ֶ ! ӳޠ ! ϓϩάϥϛϯά ! ػցֶश ! ࣗવݴޠॲཧ ͷษڧͷํʹ͍ͭͯ ·ͱΊ͍ͯΔϖʔδ
ࣗવݴޠॲཧΛಠश͍ͨ͠ਓͷͨΊʹ ࠓճॳ৺ऀ͚ͷߨٛͳͷͰ հ͚ͩʹͱͲΊ͓͖ͯ·͕͢ Կͷษڧ͕ඞཁͰ Ͳ͏ษڧ͖͔͢ ஸೡʹΘ͔Γ͘͢·ͱ·͍ͬͯΔͷͰ ੋඇ͝ཡʹͳͬͯ΄͍͠Ͱ͢ʂ
⻑岡技術科学⼤学⾃然⾔語処理研究室(YouTube) IUUQTXXXZPVUVCFDPNVTFSKOMQPSH ʮษڧձʯ͔ΒݟΔͱྑ͍ͱࢥ͍·͢
LBHHMF ࣗવݴޠॲཧܥͷίϯϖ͋Δ Θͨ͠/-1ͷίϯϖग़ͨ͜ͱͳ͍Ͱ͢
ࣗવݴޠॲཧΤϯδχΞʹͳΓ͍ͨਓ ! ػցֶशΤϯδχΞʹͳͬͯ ࣗવݴޠॲཧΔ ! ࣗવݴޠॲཧٕज़ʹಛԽͨ͠اۀʹߦ͘
ػցֶशΤϯδχΞʹͳΓ͍ͨਓ Φεεϝॻ੶ ʰػցֶशΤϯδχΞʹͳΓ͍ͨਓͷ ɹͨΊͷຊ"*Λఱ৬ʹ͢Δʱ ! ԿΛ͢Ε͍͍͔۩ମత
&OKPZ 4UVEZJOH /-1