Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
word prediction
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
tetsuroito
June 24, 2017
Technology
0
840
word prediction
第62回Tokyo.RのLT資料です
tetsuroito
June 24, 2017
Tweet
Share
More Decks by tetsuroito
See All by tetsuroito
Data Engineering Study#30 LT資料
tetsuroito
2
1.7k
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.9k
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
880
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
1
680
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
6.1k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
5k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
160
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.7k
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
2.1k
Other Decks in Technology
See All in Technology
Data Hubグループ 紹介資料
sansan33
PRO
0
2.7k
Introduction to Sansan, inc / Sansan Global Development Center, Inc.
sansan33
PRO
0
3k
Amazon S3 Vectorsを使って資格勉強用AIエージェントを構築してみた
usanchuu
3
420
ファインディの横断SREがTakumi byGMOと取り組む、セキュリティと開発スピードの両立
rvirus0817
1
990
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
1k
10Xにおける品質保証活動の全体像と改善 #no_more_wait_for_test
nihonbuson
PRO
0
120
外部キー制約の知っておいて欲しいこと - RDBMSを正しく使うために必要なこと / FOREIGN KEY Night
soudai
PRO
9
3.8k
ClickHouseはどのように大規模データを活用したAIエージェントを全社展開しているのか
mikimatsumoto
0
140
Webhook best practices for rock solid and resilient deployments
glaforge
1
210
AIと新時代を切り拓く。これからのSREとメルカリIBISの挑戦
0gm
0
660
2026年はチャンキングを極める!
shibuiwilliam
8
1.9k
Context Engineeringの取り組み
nutslove
0
220
Featured
See All Featured
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.3k
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
52
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
62
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
430
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
1.8k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
9.5k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.3k
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
sira's awesome portfolio website redesign presentation
elsirapls
0
140
What's in a price? How to price your products and services
michaelherold
247
13k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.3k
Transcript
Tokyo.R ver.62 LT ʮWord Predictionʯ 2017/06/24(sat) @ࣚཹ
ࣗݾհ ໊લɿҏ౻ ప(@tetsuroito) ࣄɿFinTechܥ झຯɿञɺαοΧʔ؍ઓɺεΩʔ ݴޠɿSQLRݴޠɻ࠷ۙPythonͬͯΔ ࠷ۙੳͱ͔͋Μ·Γ͍ͯ͠ͳ͍
એɿ࿈ࡌͬͯ·͢ ιʔγϟϧ֦ࢄͷఆྔσʔλ͕ࢲͷϞνϕͰ͢
ࠓͷLTͷ͖͔͚ͬ ;ͱ31VCTͷΤϯτϦΛݟ͍ͯͨΒɺ ԿΒ໘നͦ͏ͳͷΛൃݟͨ͠ͷͰɺ ࠓ͜ΕͷͰ͢ IUUQSQVCTDPN.BMPSFBO
എܠͱϞνϕʔγϣϯ ɾܞଳΩʔϘʔυϨΠΞτʹখ͍͞ ɾॖͨ͠ϫʔυΛଧͪࠐΉ͍͔ͭ͘ͷख๏͕͋Δ T9 (Text on 9keys):ΨϥέʔϘλϯΈ͍ͨͷ Sliding:εϚϑΥͷΩʔϘʔυ ༧ଌม ͜ͷ1+ೖྗ͞ΕͨϑϨʔζʹ࠷͋Γͦ͏ͳޠΛ
༧ଌͯ͠ఏࣔ͢Δͱ͍͏ͷ
ߏ Capstone Dataset RͰ࣮ݱ ख๏ɿTMɺQuantedaɺtext2vec DBɿSqlite using RSQlite εϐʔυͱγϯϓϧ͞Ͱ্هͷબఆ
σʔλϞσϧ ετοϓϫʔυͳ͠ N-GramΛར༻Ͱ(2-Gram͔Β7-Gram) ༧ଌม
N-Gram n-1ޠΛจ຺ͱͯ࣍͠ͷޠΛ༧ଌ จࣈn-gram ୯ޠn-gram class n-gramͳͲ ࣗવݴޠॲཧʹ͓͚ΔҰൠతͳݴޠϞσϧͰ͢
݁ՌShiny Appʹ IUUQTNBMPSFBOTIJOZBQQTJP8PSE1SFEJDUJPO
݁ ɾ՝ ɹ5.ύοέʔδͷେ͖͍σʔληοτͷύϑΥʔϚϯε ɹΠϯϑϧΤϯβʹ͔͔ͬͯ࣌ؒͱΒΕͪΌͬͨ ɾֶͼ ɹXPSLJUFSBUJWF ɹͬͱίʔυσʔλখ͘͞Ͱ͖Δ͔ ɾࠓޙͷൃలʹΉ͚ͯ ɹҧ͏σʔλͰࢼ͍ͨ͠ ɹ4LJQ(SBNΛ͏
ɹ,OFTFS/FZ,BU[`TCBDLP⒎ͰεϜʔδϯά
͝੩ௌ͋Γ͕ͱ͏ ͍͟͝·ͨ͠ʂ