Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
word prediction
Search
tetsuroito
June 24, 2017
Technology
840
0
Share
word prediction
第62回Tokyo.RのLT資料です
tetsuroito
June 24, 2017
More Decks by tetsuroito
See All by tetsuroito
Data Engineering Study#30 LT資料
tetsuroito
2
1.9k
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.9k
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
890
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
1
700
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
6.2k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
5.1k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
170
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.7k
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
2.1k
Other Decks in Technology
See All in Technology
マルチモーダル非構造データとの闘い
shibuiwilliam
1
180
Oracle Cloud Infrastructure:2026年3月度サービス・アップデート
oracle4engineer
PRO
0
380
組織的なAI活用を阻む 最大のハードルは コンテキストデザインだった
ixbox
1
560
会社紹介資料 / Sansan Company Profile
sansan33
PRO
16
410k
Cortex Codeでデータの仕事を全部Agenticにやりきろう!
gappy50
0
300
ASTのGitHub CopilotとCopilot CLIの現在地をお話しします/How AST Operates GitHub Copilot and Copilot CLI
aeonpeople
1
130
プロダクトを育てるように生成AIによる開発プロセスを育てよう
kakehashi
PRO
1
640
スケーリングを封じられたEC2を救いたい
senseofunity129
0
140
不確実性と戦いながら見積もりを作成するプロセス/mitsumori-process
hirodragon112
1
190
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
6
1.3k
40代からのアウトプット ― 経験は価値ある学びに変わる / 20260404 Naoki Takahashi
shift_evolve
PRO
5
830
Databricks Appsで実現する社内向けAIアプリ開発の効率化
r_miura
0
320
Featured
See All Featured
Amusing Abliteration
ianozsvald
1
150
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
980
Fireside Chat
paigeccino
42
3.9k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
310
How to build a perfect <img>
jonoalderson
1
5.3k
The Curious Case for Waylosing
cassininazir
0
290
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.2k
Evolving SEO for Evolving Search Engines
ryanjones
0
170
Documentation Writing (for coders)
carmenintech
77
5.3k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
160
The Invisible Side of Design
smashingmag
302
51k
Testing 201, or: Great Expectations
jmmastey
46
8.1k
Transcript
Tokyo.R ver.62 LT ʮWord Predictionʯ 2017/06/24(sat) @ࣚཹ
ࣗݾհ ໊લɿҏ౻ ప(@tetsuroito) ࣄɿFinTechܥ झຯɿञɺαοΧʔ؍ઓɺεΩʔ ݴޠɿSQLRݴޠɻ࠷ۙPythonͬͯΔ ࠷ۙੳͱ͔͋Μ·Γ͍ͯ͠ͳ͍
એɿ࿈ࡌͬͯ·͢ ιʔγϟϧ֦ࢄͷఆྔσʔλ͕ࢲͷϞνϕͰ͢
ࠓͷLTͷ͖͔͚ͬ ;ͱ31VCTͷΤϯτϦΛݟ͍ͯͨΒɺ ԿΒ໘നͦ͏ͳͷΛൃݟͨ͠ͷͰɺ ࠓ͜ΕͷͰ͢ IUUQSQVCTDPN.BMPSFBO
എܠͱϞνϕʔγϣϯ ɾܞଳΩʔϘʔυϨΠΞτʹখ͍͞ ɾॖͨ͠ϫʔυΛଧͪࠐΉ͍͔ͭ͘ͷख๏͕͋Δ T9 (Text on 9keys):ΨϥέʔϘλϯΈ͍ͨͷ Sliding:εϚϑΥͷΩʔϘʔυ ༧ଌม ͜ͷ1+ೖྗ͞ΕͨϑϨʔζʹ࠷͋Γͦ͏ͳޠΛ
༧ଌͯ͠ఏࣔ͢Δͱ͍͏ͷ
ߏ Capstone Dataset RͰ࣮ݱ ख๏ɿTMɺQuantedaɺtext2vec DBɿSqlite using RSQlite εϐʔυͱγϯϓϧ͞Ͱ্هͷબఆ
σʔλϞσϧ ετοϓϫʔυͳ͠ N-GramΛར༻Ͱ(2-Gram͔Β7-Gram) ༧ଌม
N-Gram n-1ޠΛจ຺ͱͯ࣍͠ͷޠΛ༧ଌ จࣈn-gram ୯ޠn-gram class n-gramͳͲ ࣗવݴޠॲཧʹ͓͚ΔҰൠతͳݴޠϞσϧͰ͢
݁ՌShiny Appʹ IUUQTNBMPSFBOTIJOZBQQTJP8PSE1SFEJDUJPO
݁ ɾ՝ ɹ5.ύοέʔδͷେ͖͍σʔληοτͷύϑΥʔϚϯε ɹΠϯϑϧΤϯβʹ͔͔ͬͯ࣌ؒͱΒΕͪΌͬͨ ɾֶͼ ɹXPSLJUFSBUJWF ɹͬͱίʔυσʔλখ͘͞Ͱ͖Δ͔ ɾࠓޙͷൃలʹΉ͚ͯ ɹҧ͏σʔλͰࢼ͍ͨ͠ ɹ4LJQ(SBNΛ͏
ɹ,OFTFS/FZ,BU[`TCBDLP⒎ͰεϜʔδϯά
͝੩ௌ͋Γ͕ͱ͏ ͍͟͝·ͨ͠ʂ