Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
word prediction
Search
tetsuroito
June 24, 2017
Technology
0
780
word prediction
第62回Tokyo.RのLT資料です
tetsuroito
June 24, 2017
Tweet
Share
More Decks by tetsuroito
See All by tetsuroito
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.7k
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
790
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
1
590
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
5.5k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
4.6k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
110
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.4k
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
1.8k
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて
tetsuroito
3
3.2k
Other Decks in Technology
See All in Technology
株式会社ログラス − エンジニア向け会社説明資料 / Loglass Comapany Deck for Engineer
loglass2019
3
32k
普通のエンジニアがLaravelコアチームメンバーになるまで
avosalmon
0
110
コンテナセキュリティのためのLandlock入門
nullpo_head
2
320
DUSt3R, MASt3R, MASt3R-SfM にみる3D基盤モデル
spatial_ai_network
2
180
Qiita埋め込み用スライド
naoki_0531
0
5.1k
継続的にアウトカムを生み出し ビジネスにつなげる、 戦略と運営に対するタイミーのQUEST(探求)
zigorou
0
590
DevOps視点でAWS re:invent2024の新サービス・アプデを振り返ってみた
oshanqq
0
180
PHPからGoへのマイグレーション for DMMアフィリエイト
yabakokobayashi
1
170
LINEヤフーのフロントエンド組織・体制の紹介【24年12月】
lycorp_recruit_jp
0
530
ずっと昔に Star をつけたはずの思い出せない GitHub リポジトリを見つけたい!
rokuosan
0
150
祝!Iceberg祭開幕!re:Invent 2024データレイク関連アップデート10分総ざらい
kniino
3
310
組織に自動テストを書く文化を根付かせる戦略(2024冬版) / Building Automated Test Culture 2024 Winter Edition
twada
PRO
17
4.7k
Featured
See All Featured
GraphQLとの向き合い方2022年版
quramy
44
13k
Art, The Web, and Tiny UX
lynnandtonic
298
20k
Writing Fast Ruby
sferik
628
61k
Code Reviewing Like a Champion
maltzj
520
39k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
247
1.3M
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
A better future with KSS
kneath
238
17k
Scaling GitHub
holman
458
140k
A Tale of Four Properties
chriscoyier
157
23k
Documentation Writing (for coders)
carmenintech
66
4.5k
Adopting Sorbet at Scale
ufuk
73
9.1k
Practical Orchestrator
shlominoach
186
10k
Transcript
Tokyo.R ver.62 LT ʮWord Predictionʯ 2017/06/24(sat) @ࣚཹ
ࣗݾհ ໊લɿҏ౻ ప(@tetsuroito) ࣄɿFinTechܥ झຯɿञɺαοΧʔ؍ઓɺεΩʔ ݴޠɿSQLRݴޠɻ࠷ۙPythonͬͯΔ ࠷ۙੳͱ͔͋Μ·Γ͍ͯ͠ͳ͍
એɿ࿈ࡌͬͯ·͢ ιʔγϟϧ֦ࢄͷఆྔσʔλ͕ࢲͷϞνϕͰ͢
ࠓͷLTͷ͖͔͚ͬ ;ͱ31VCTͷΤϯτϦΛݟ͍ͯͨΒɺ ԿΒ໘നͦ͏ͳͷΛൃݟͨ͠ͷͰɺ ࠓ͜ΕͷͰ͢ IUUQSQVCTDPN.BMPSFBO
എܠͱϞνϕʔγϣϯ ɾܞଳΩʔϘʔυϨΠΞτʹখ͍͞ ɾॖͨ͠ϫʔυΛଧͪࠐΉ͍͔ͭ͘ͷख๏͕͋Δ T9 (Text on 9keys):ΨϥέʔϘλϯΈ͍ͨͷ Sliding:εϚϑΥͷΩʔϘʔυ ༧ଌม ͜ͷ1+ೖྗ͞ΕͨϑϨʔζʹ࠷͋Γͦ͏ͳޠΛ
༧ଌͯ͠ఏࣔ͢Δͱ͍͏ͷ
ߏ Capstone Dataset RͰ࣮ݱ ख๏ɿTMɺQuantedaɺtext2vec DBɿSqlite using RSQlite εϐʔυͱγϯϓϧ͞Ͱ্هͷબఆ
σʔλϞσϧ ετοϓϫʔυͳ͠ N-GramΛར༻Ͱ(2-Gram͔Β7-Gram) ༧ଌม
N-Gram n-1ޠΛจ຺ͱͯ࣍͠ͷޠΛ༧ଌ จࣈn-gram ୯ޠn-gram class n-gramͳͲ ࣗવݴޠॲཧʹ͓͚ΔҰൠతͳݴޠϞσϧͰ͢
݁ՌShiny Appʹ IUUQTNBMPSFBOTIJOZBQQTJP8PSE1SFEJDUJPO
݁ ɾ՝ ɹ5.ύοέʔδͷେ͖͍σʔληοτͷύϑΥʔϚϯε ɹΠϯϑϧΤϯβʹ͔͔ͬͯ࣌ؒͱΒΕͪΌͬͨ ɾֶͼ ɹXPSLJUFSBUJWF ɹͬͱίʔυσʔλখ͘͞Ͱ͖Δ͔ ɾࠓޙͷൃలʹΉ͚ͯ ɹҧ͏σʔλͰࢼ͍ͨ͠ ɹ4LJQ(SBNΛ͏
ɹ,OFTFS/FZ,BU[`TCBDLP⒎ͰεϜʔδϯά
͝੩ௌ͋Γ͕ͱ͏ ͍͟͝·ͨ͠ʂ