Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Exploratory Hour #97 - 同じ文章の中で使われる単語の組み合わせを「グルー...
Search
Takato Shiroto
December 22, 2020
Technology
0
97
Exploratory Hour #97 - 同じ文章の中で使われる単語の組み合わせを「グループごと」に集計したい
2020/12/22(火)に開催したExploratory Hourのスライドです。
文章が単語化されたデータから、単語の組み合わせをグループごとに集計する方法を紹介しています。
Takato Shiroto
December 22, 2020
Tweet
Share
More Decks by Takato Shiroto
See All by Takato Shiroto
Exploratory v6.7の紹介
takatoshiroto
0
900
Exploratory v6.6の紹介
takatoshiroto
0
1.6k
Exploratory v6.5の紹介
takatoshiroto
0
5.1k
コンバージョン率と信頼区間の推移を可視化する方法
takatoshiroto
1
300
Exploratory Hour #104 - 別の列の値をもとに、カテゴリー列の値の順序を指定したい
takatoshiroto
0
180
Exploratory Hour #105 - 元のデータ順をもとに、カテゴリー列の値の順序を指定したい
takatoshiroto
1
240
Exploratory Hour #102 - complete関数を使って2つの時間の間の値を生成したい
takatoshiroto
0
100
Exploratory Hour #103 - 仕事の開始・終了時間データから、どの時間に何人働いているか知りたい
takatoshiroto
0
99
Exploratory v6.4の紹介
takatoshiroto
0
5.8k
Other Decks in Technology
See All in Technology
Oracle Base Database Service:サービス概要のご紹介
oracle4engineer
PRO
1
16k
#TRG24 / David Cuartielles / Post Open Source
tarugoconf
0
580
I could be Wrong!! - Learning from Agile Experts
kawaguti
PRO
8
3.4k
[IBM TechXchange Dojo]Watson Discoveryとwatsonx.aiでRAGを実現!座学①
siyuanzh09
0
110
【JAWS-UG大阪 reInvent reCap LT大会 サンバが始まったら強制終了】“1分”で初めてのソロ参戦reInventを数字で振り返りながら反省する
ttelltte
0
140
Visual StudioとかIDE関連小ネタ話
kosmosebi
1
370
コロプラのオンボーディングを採用から語りたい
colopl
5
1.3k
20250116_JAWS_Osaka
takuyay0ne
2
200
Amazon Route 53, 待ちに待った TLSAレコードのサポート開始
kenichinakamura
0
170
FODにおけるホーム画面編成のレコメンド
watarukudo
PRO
2
280
なぜfreeeはハブ・アンド・スポーク型の データメッシュアーキテクチャにチャレンジするのか?
shinichiro_joya
2
470
Kotlin Multiplatformのポテンシャル
recruitengineers
PRO
2
150
Featured
See All Featured
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
44
9.4k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
How to Ace a Technical Interview
jacobian
276
23k
The Cost Of JavaScript in 2023
addyosmani
46
7.2k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
Statistics for Hackers
jakevdp
797
220k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
45
2.3k
Navigating Team Friction
lara
183
15k
Rebuilding a faster, lazier Slack
samanthasiow
79
8.8k
The World Runs on Bad Software
bkeepers
PRO
66
11k
Designing for Performance
lara
604
68k
Git: the NoSQL Database
bkeepers
PRO
427
64k
Transcript
EXPLORATORY 1
2 εϐʔΧʔ നށ ܟొ Customer Succes EXPLORATORY ུྺ େֶࡏֶதʹϑʔυϩεΛݮΒͨ͢ΊʹɺֶੜஂମΛ্ཱͪ͛දΛ ΊΔɻͦͷޙɺϏδωεΛΔͨΊʹԽֶϝʔΧʔͷσϡϙϯͱ
ϑʔυςοΫܥελʔτΞοϓͰӦۀͱϚʔέςΟϯάΛܦݧɻ ΞϓϦͷͷͨΊʹσʔλαΠΤϯε͕ඞཁͩͱײ͡ɺΞϓϦʹ ಛԽͨ͠ϢʔβʔͷߦಈੳπʔϧΛ։ൃ͢ΔاۀʹͯɺΞϓϦۀք ͷKPIੳͳͲΛ୲͢Δɻ ݱࡏExploratory, Inc. ͰΧελϚʔαΫηεΛ୲͢ΔΒɺσʔ λͷՄࢹԽͱ୳ࡧతσʔλੳΛઐͱͯ͠σʔλαΠΤϯεͷීٴ ʹऔΓΉɻ @ShirotoTakato
3 • ࣭͝zoomͷνϟοτʹ͝ߘ͍ͩ͘͞ɻ • ηϛφʔͷײʹཱͭใΛTwitterͰϋογϡλάΛ ͚ͭͯπΠʔτΛ͓ئ͍͠·͢ɻ #Exploratoryηϛφʔ Exploratory Hour
Exploratory Hour
• ಉ͡จষͷதͰΘΕΔ୯ޠͷΈ߹ΘͤΛʮάϧʔϓ͝ͱʯʹू ܭ͍ͨ͠ • όʔͱϥΠϯΛΈ߹ΘͤͨνϟʔτΛ࡞Γ͍ͨ ࠓिͷ࣭
• ಉ͡จষͷதͰΘΕΔ୯ޠͷΈ߹ΘͤΛʮάϧʔϓ͝ͱʯʹ ूܭ͍ͨ͠ • όʔͱϥΠϯΛΈ߹ΘͤͨνϟʔτΛ࡞Γ͍ͨ ࠓिͷ࣭
7 Twitter search͔ΒʮσʔλαΠΤϯεʯͷΩʔϫʔυͰऔಘͨ͠πΠʔτ(จ ষ)Λ୯ޠԽͨ͠σʔλ
8 จষΛ୯ޠԽ͢Δ
9 ୯ޠԽͨ͠σʔλΛϫʔυΫϥυͰՄࢹԽ͢Δ
10 ͜ͷํ๏ͰɺΑ͘ΘΕΔ୯ޠՄࢹԽͰ͖Δ͕ɺҰॹʹΘΕ͍ͯΔ୯ޠ Θ͔Βͳ͍ɻ
ಉ͡จষͷதͰҰॹʹΘΕΔ୯ޠͷΈ߹ ΘͤΛΓ͍ͨɻ 11
12 ྫ͑ɺAIͱػցֶशΑ͘ҰॹʹΘΕΔͷͰͳ͍͔ʁ
13 ୯ޠͷΈ߹ΘͤΛ͑Δɻ document_id token count 1 σʔλ 1 1 αΠΤϯε
1 1 ֶश 1 document_id token_x token_y value 1 σʔλ αΠΤϯε 1 1 αΠΤϯε ֶश 1 1 ֶश σʔλ 1
14 ςΩετσʔλͷՃʹ͋Δʮ୯ޠͷΈ߹ΘͤΛΧϯτʯ͔Β࣮ߦͰ͖Δɻ
15 ୯ޠͷΈ߹ΘͤΛ͑ͨσʔλ
16 ୯ޠͷΈ߹ΘͤΛόʔνϟʔτͰՄࢹԽ
17
18 ʮ୯ޠʯͰݕࡧ
σόΠεʹΑͬͯҰॹʹΘΕΔ୯ޠͷ Έ߹Θͤͷʹҧ͍͋Δͷ͔ʁ 19
20 άϧʔϓʢσόΠεʣ͝ͱʹ୯ޠͷΈ߹ΘͤͷΛूܭ͢Δɻ device token_x token_y value mobile σʔλ αΠΤϯε 10
mobile σʔλ ߴߍੜ 6 mobile ߴߍੜ ߨٛ 5 mobile ڭҭ σʔλ 5 pc σʔλ αΠΤϯε 8 pc σʔλ ࣾձਓ 6 pc ࣾձਓ ߨ࠲ 5 pc େֶ ࣾձਓ 4
21 ݩʑͷσʔλʹdeviceͷྻ͕͋Δɻ
22 ͔͠͠ɺ୯ޠԽͨ͠ࡍʹଞͷྻ͕ফ͑ͯ͠·͍ͬͯΔΑ͏ͩɻ
23 จষΛ୯ޠԽͨ͠εςοϓͷτʔΫϯΛΫϦοΫ͢Δɻ
24 ଞͷྻΛอ࣋͢Δʹʮ͍ʯΛબ࣮ͯ͠ߦ͢Δɻ
25 ୯ޠԽ͢ΔࡍʹଞͷྻΛ͢͜ͱ͕Ͱ͖ͨɻ
26 ςΩετϖΞΛΧϯτͷεςοϓͷτʔΫϯΛΫϦοΫ͢Δɻ
27 άϧʔϓԽ͢ΔྻʹʮdeviceʯΛબ࣮ͯ͠ߦ͢Δɻ
28 device͝ͱʹ୯ޠͷΈ߹ΘͤΛٻΊΔ͜ͱ͕Ͱ͖ͨɻ
29 όʔνϟʔτͷ܁Γฦ͠ʹʮdeviceʯΛબ͢Δɻ
30 mobileͷϢʔβʔঁࢠɺ౦ژɺதߴɺڭ͑Δͱ͍ͬͨ୯ޠ͕ΘΕ͓ͯΓɺ pcϢʔβʔͰɺAIɺେࡕɺۀɺߨ࠲ͱ͍ͬͨ୯ޠ͕ΘΕ͍ͯΔɻ
31 TwitterΛݟͯΈΔͱɺ౦ژঁࢠֶԂͱ͍͏ֶߍͰதߴੜʹσʔλαΠΤϯεΛڭ͍͑ͯΔͷ ͱɺେࡕۀେֶͰࣾձਓ͚ͷσʔλαΠΤϯεߨ࠲͕։ߨ͞ΕͨΑ͏ͩɻ
࣍ճηϛφʔ
EXPLORATORY ΦϯϥΠϯɾηϛφʔ #41 ͳͥExcelϢʔβʔ ExploratoryΛ͏͖ͳͷ͔
None
35
None
2݄ΦϯϥΠϯ։࠵ʂ ฏ൛: 2݄2(Ր), 3(ਫ), 4()
None
• ϏδωεͰ͑Δࢥߟྗͷҭ σʔλαΠΤϯεͷεΩϧशಘ͚ͩͰͳ͘ɺσʔλΛͬͨΑΓΑ͍ҙࢥܾఆΛߦ͏ͨ Ίʹඞཁͳ౷ܭతɾ֬తࢥߟྗशಘͰ͖Δɻ • ݱͰ͑ΔεΩϧͷशಘ ڭࣨͷத͚ͩͰ௨༻͢ΔཧΑΓɺ࣮ࡍͷϏδωεͷݱͰͷΛղܾ͢ΔͨΊʹ ͑ΔεΩϧͷशಘʹॏ৺Λ͓͍ͨτϨʔχϯάɻ • ϓϩάϥϛϯάͳ͠
RݴޠͷUIͰ͋ΔExploratoryΛੳπʔϧͱͯ͠༻͢ΔͨΊɺࢥߟྗͱσʔλαΠΤϯ εͷख๏ͷशಘʹ100ˋूதͰ͖Δɻ ಛ
σʔλϥϯάϦϯάɾτϨʔχϯά 2݄։࠵ʂ EXPLORATORY
2݄ΦϯϥΠϯ։࠵ʂ ฏ൛: 2݄18(),19(ۚ)
None
Q & A
Contact Email
[email protected]
Twitter Hashtag #ExploratoryHour ͰπΠʔτʂ Twitter @ExploratoryJp Exploratory
Hour https://bit.ly/30odd9q
EXPLORATORY