Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Exploratory Hour #97 - 同じ文章の中で使われる単語の組み合わせを「グルー...
Search
Takato Shiroto
December 22, 2020
Technology
0
96
Exploratory Hour #97 - 同じ文章の中で使われる単語の組み合わせを「グループごと」に集計したい
2020/12/22(火)に開催したExploratory Hourのスライドです。
文章が単語化されたデータから、単語の組み合わせをグループごとに集計する方法を紹介しています。
Takato Shiroto
December 22, 2020
Tweet
Share
More Decks by Takato Shiroto
See All by Takato Shiroto
Exploratory v6.7の紹介
takatoshiroto
0
900
Exploratory v6.6の紹介
takatoshiroto
0
1.6k
Exploratory v6.5の紹介
takatoshiroto
0
5.1k
コンバージョン率と信頼区間の推移を可視化する方法
takatoshiroto
1
300
Exploratory Hour #104 - 別の列の値をもとに、カテゴリー列の値の順序を指定したい
takatoshiroto
0
170
Exploratory Hour #105 - 元のデータ順をもとに、カテゴリー列の値の順序を指定したい
takatoshiroto
1
230
Exploratory Hour #102 - complete関数を使って2つの時間の間の値を生成したい
takatoshiroto
0
99
Exploratory Hour #103 - 仕事の開始・終了時間データから、どの時間に何人働いているか知りたい
takatoshiroto
0
97
Exploratory v6.4の紹介
takatoshiroto
0
5.8k
Other Decks in Technology
See All in Technology
データプロダクトの定義からはじめる、データコントラクト駆動なデータ基盤
chanyou0311
2
330
個人でもIAM Identity Centerを使おう!(アクセス管理編)
ryder472
4
230
OCI Security サービス 概要
oracle4engineer
PRO
0
6.5k
Why App Signing Matters for Your Android Apps - Android Bangkok Conference 2024
akexorcist
0
130
DynamoDB でスロットリングが発生したとき_大盛りver/when_throttling_occurs_in_dynamodb_long
emiki
1
430
いざ、BSC討伐の旅
nikinusu
2
780
AWS Lambdaと歩んだ“サーバーレス”と今後 #lambda_10years
yoshidashingo
1
180
サイバーセキュリティと認知バイアス:対策の隙を埋める心理学的アプローチ
shumei_ito
0
390
[CV勉強会@関東 ECCV2024 読み会] オンラインマッピング x トラッキング MapTracker: Tracking with Strided Memory Fusion for Consistent Vector HD Mapping (Chen+, ECCV24)
abemii
0
220
OCI Network Firewall 概要
oracle4engineer
PRO
0
4.2k
Introduction to Works of ML Engineer in LY Corporation
lycorp_recruit_jp
0
140
Engineer Career Talk
lycorp_recruit_jp
0
190
Featured
See All Featured
GitHub's CSS Performance
jonrohan
1030
460k
RailsConf 2023
tenderlove
29
900
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
4
370
GraphQLの誤解/rethinking-graphql
sonatard
67
10k
Building Adaptive Systems
keathley
38
2.3k
Why Our Code Smells
bkeepers
PRO
334
57k
Reflections from 52 weeks, 52 projects
jeffersonlam
346
20k
The Cult of Friendly URLs
andyhume
78
6k
VelocityConf: Rendering Performance Case Studies
addyosmani
325
24k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Building Flexible Design Systems
yeseniaperezcruz
327
38k
Transcript
EXPLORATORY 1
2 εϐʔΧʔ നށ ܟొ Customer Succes EXPLORATORY ུྺ େֶࡏֶதʹϑʔυϩεΛݮΒͨ͢ΊʹɺֶੜஂମΛ্ཱͪ͛දΛ ΊΔɻͦͷޙɺϏδωεΛΔͨΊʹԽֶϝʔΧʔͷσϡϙϯͱ
ϑʔυςοΫܥελʔτΞοϓͰӦۀͱϚʔέςΟϯάΛܦݧɻ ΞϓϦͷͷͨΊʹσʔλαΠΤϯε͕ඞཁͩͱײ͡ɺΞϓϦʹ ಛԽͨ͠ϢʔβʔͷߦಈੳπʔϧΛ։ൃ͢ΔاۀʹͯɺΞϓϦۀք ͷKPIੳͳͲΛ୲͢Δɻ ݱࡏExploratory, Inc. ͰΧελϚʔαΫηεΛ୲͢ΔΒɺσʔ λͷՄࢹԽͱ୳ࡧతσʔλੳΛઐͱͯ͠σʔλαΠΤϯεͷීٴ ʹऔΓΉɻ @ShirotoTakato
3 • ࣭͝zoomͷνϟοτʹ͝ߘ͍ͩ͘͞ɻ • ηϛφʔͷײʹཱͭใΛTwitterͰϋογϡλάΛ ͚ͭͯπΠʔτΛ͓ئ͍͠·͢ɻ #Exploratoryηϛφʔ Exploratory Hour
Exploratory Hour
• ಉ͡จষͷதͰΘΕΔ୯ޠͷΈ߹ΘͤΛʮάϧʔϓ͝ͱʯʹू ܭ͍ͨ͠ • όʔͱϥΠϯΛΈ߹ΘͤͨνϟʔτΛ࡞Γ͍ͨ ࠓिͷ࣭
• ಉ͡จষͷதͰΘΕΔ୯ޠͷΈ߹ΘͤΛʮάϧʔϓ͝ͱʯʹ ूܭ͍ͨ͠ • όʔͱϥΠϯΛΈ߹ΘͤͨνϟʔτΛ࡞Γ͍ͨ ࠓिͷ࣭
7 Twitter search͔ΒʮσʔλαΠΤϯεʯͷΩʔϫʔυͰऔಘͨ͠πΠʔτ(จ ষ)Λ୯ޠԽͨ͠σʔλ
8 จষΛ୯ޠԽ͢Δ
9 ୯ޠԽͨ͠σʔλΛϫʔυΫϥυͰՄࢹԽ͢Δ
10 ͜ͷํ๏ͰɺΑ͘ΘΕΔ୯ޠՄࢹԽͰ͖Δ͕ɺҰॹʹΘΕ͍ͯΔ୯ޠ Θ͔Βͳ͍ɻ
ಉ͡จষͷதͰҰॹʹΘΕΔ୯ޠͷΈ߹ ΘͤΛΓ͍ͨɻ 11
12 ྫ͑ɺAIͱػցֶशΑ͘ҰॹʹΘΕΔͷͰͳ͍͔ʁ
13 ୯ޠͷΈ߹ΘͤΛ͑Δɻ document_id token count 1 σʔλ 1 1 αΠΤϯε
1 1 ֶश 1 document_id token_x token_y value 1 σʔλ αΠΤϯε 1 1 αΠΤϯε ֶश 1 1 ֶश σʔλ 1
14 ςΩετσʔλͷՃʹ͋Δʮ୯ޠͷΈ߹ΘͤΛΧϯτʯ͔Β࣮ߦͰ͖Δɻ
15 ୯ޠͷΈ߹ΘͤΛ͑ͨσʔλ
16 ୯ޠͷΈ߹ΘͤΛόʔνϟʔτͰՄࢹԽ
17
18 ʮ୯ޠʯͰݕࡧ
σόΠεʹΑͬͯҰॹʹΘΕΔ୯ޠͷ Έ߹Θͤͷʹҧ͍͋Δͷ͔ʁ 19
20 άϧʔϓʢσόΠεʣ͝ͱʹ୯ޠͷΈ߹ΘͤͷΛूܭ͢Δɻ device token_x token_y value mobile σʔλ αΠΤϯε 10
mobile σʔλ ߴߍੜ 6 mobile ߴߍੜ ߨٛ 5 mobile ڭҭ σʔλ 5 pc σʔλ αΠΤϯε 8 pc σʔλ ࣾձਓ 6 pc ࣾձਓ ߨ࠲ 5 pc େֶ ࣾձਓ 4
21 ݩʑͷσʔλʹdeviceͷྻ͕͋Δɻ
22 ͔͠͠ɺ୯ޠԽͨ͠ࡍʹଞͷྻ͕ফ͑ͯ͠·͍ͬͯΔΑ͏ͩɻ
23 จষΛ୯ޠԽͨ͠εςοϓͷτʔΫϯΛΫϦοΫ͢Δɻ
24 ଞͷྻΛอ࣋͢Δʹʮ͍ʯΛબ࣮ͯ͠ߦ͢Δɻ
25 ୯ޠԽ͢ΔࡍʹଞͷྻΛ͢͜ͱ͕Ͱ͖ͨɻ
26 ςΩετϖΞΛΧϯτͷεςοϓͷτʔΫϯΛΫϦοΫ͢Δɻ
27 άϧʔϓԽ͢ΔྻʹʮdeviceʯΛબ࣮ͯ͠ߦ͢Δɻ
28 device͝ͱʹ୯ޠͷΈ߹ΘͤΛٻΊΔ͜ͱ͕Ͱ͖ͨɻ
29 όʔνϟʔτͷ܁Γฦ͠ʹʮdeviceʯΛબ͢Δɻ
30 mobileͷϢʔβʔঁࢠɺ౦ژɺதߴɺڭ͑Δͱ͍ͬͨ୯ޠ͕ΘΕ͓ͯΓɺ pcϢʔβʔͰɺAIɺେࡕɺۀɺߨ࠲ͱ͍ͬͨ୯ޠ͕ΘΕ͍ͯΔɻ
31 TwitterΛݟͯΈΔͱɺ౦ژঁࢠֶԂͱ͍͏ֶߍͰதߴੜʹσʔλαΠΤϯεΛڭ͍͑ͯΔͷ ͱɺେࡕۀେֶͰࣾձਓ͚ͷσʔλαΠΤϯεߨ࠲͕։ߨ͞ΕͨΑ͏ͩɻ
࣍ճηϛφʔ
EXPLORATORY ΦϯϥΠϯɾηϛφʔ #41 ͳͥExcelϢʔβʔ ExploratoryΛ͏͖ͳͷ͔
None
35
None
2݄ΦϯϥΠϯ։࠵ʂ ฏ൛: 2݄2(Ր), 3(ਫ), 4()
None
• ϏδωεͰ͑Δࢥߟྗͷҭ σʔλαΠΤϯεͷεΩϧशಘ͚ͩͰͳ͘ɺσʔλΛͬͨΑΓΑ͍ҙࢥܾఆΛߦ͏ͨ Ίʹඞཁͳ౷ܭతɾ֬తࢥߟྗशಘͰ͖Δɻ • ݱͰ͑ΔεΩϧͷशಘ ڭࣨͷத͚ͩͰ௨༻͢ΔཧΑΓɺ࣮ࡍͷϏδωεͷݱͰͷΛղܾ͢ΔͨΊʹ ͑ΔεΩϧͷशಘʹॏ৺Λ͓͍ͨτϨʔχϯάɻ • ϓϩάϥϛϯάͳ͠
RݴޠͷUIͰ͋ΔExploratoryΛੳπʔϧͱͯ͠༻͢ΔͨΊɺࢥߟྗͱσʔλαΠΤϯ εͷख๏ͷशಘʹ100ˋूதͰ͖Δɻ ಛ
σʔλϥϯάϦϯάɾτϨʔχϯά 2݄։࠵ʂ EXPLORATORY
2݄ΦϯϥΠϯ։࠵ʂ ฏ൛: 2݄18(),19(ۚ)
None
Q & A
Contact Email
[email protected]
Twitter Hashtag #ExploratoryHour ͰπΠʔτʂ Twitter @ExploratoryJp Exploratory
Hour https://bit.ly/30odd9q
EXPLORATORY