Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Exploratory Hour #97 - 同じ文章の中で使われる単語の組み合わせを「グルー...
Search
Takato Shiroto
December 22, 2020
Technology
120
0
Share
Exploratory Hour #97 - 同じ文章の中で使われる単語の組み合わせを「グループごと」に集計したい
2020/12/22(火)に開催したExploratory Hourのスライドです。
文章が単語化されたデータから、単語の組み合わせをグループごとに集計する方法を紹介しています。
Takato Shiroto
December 22, 2020
More Decks by Takato Shiroto
See All by Takato Shiroto
Exploratory v6.7の紹介
takatoshiroto
0
920
Exploratory v6.6の紹介
takatoshiroto
0
1.6k
Exploratory v6.5の紹介
takatoshiroto
0
5.1k
コンバージョン率と信頼区間の推移を可視化する方法
takatoshiroto
1
360
Exploratory Hour #104 - 別の列の値をもとに、カテゴリー列の値の順序を指定したい
takatoshiroto
0
250
Exploratory Hour #105 - 元のデータ順をもとに、カテゴリー列の値の順序を指定したい
takatoshiroto
1
320
Exploratory Hour #102 - complete関数を使って2つの時間の間の値を生成したい
takatoshiroto
0
150
Exploratory Hour #103 - 仕事の開始・終了時間データから、どの時間に何人働いているか知りたい
takatoshiroto
0
130
Exploratory v6.4の紹介
takatoshiroto
0
5.8k
Other Decks in Technology
See All in Technology
シンデレラなんかになりたくない!ガラスの靴が割れた時代にどう歩く?
nomizone
0
210
『家族アルバム みてね』における インシデント対応との向き合い方 / Approach incident response in Family Album
kohbis
2
230
自称宇宙最速で不合格となったAIP-C01にリベンジを果たすべくAIで問題集アプリを作ってみた。
yama3133
0
220
大学生が本気でDatabricksを活用してDiscordサークルをデータ駆動させてみた
phantomjuju
0
230
Anthropic AIネイティブ・スタートアップ構築のプレイブック を理解する
nagatsu
0
200
大規模環境でどのように監視を実現する?
yuobayashi
1
260
TROCCOで始めるクラウドコストを民主化するためのFinOps
tk3fftk
1
250
Copilot CLI・IDE・Web・スマホで途切れない開発フローを目指して / One Copilot flow - CLI IDE Web Mobile
aeonpeople
1
1.1k
イベントストーミングとKiroの仕様駆動開発で実現する要件の認識合わせプロセス
syobochim
7
820
layerx-fde-practices
cipepser
6
2.8k
Java正規表現エンジン(NFA)の仕組みと パフォーマンスを維持するための最適化手法
takeuchi_132917
0
130
速さだけじゃない! VoidZero ツールが移行先に選ばれる理由
mizdra
PRO
4
300
Featured
See All Featured
Optimizing for Happiness
mojombo
378
71k
Why Our Code Smells
bkeepers
PRO
340
58k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
65
55k
How to train your dragon (web standard)
notwaldorf
97
6.6k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4k
Design in an AI World
tapps
1
220
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
820
The Language of Interfaces
destraynor
162
26k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
3.2k
Docker and Python
trallard
47
3.8k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.7k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
200
Transcript
EXPLORATORY 1
2 εϐʔΧʔ നށ ܟొ Customer Succes EXPLORATORY ུྺ େֶࡏֶதʹϑʔυϩεΛݮΒͨ͢ΊʹɺֶੜஂମΛ্ཱͪ͛දΛ ΊΔɻͦͷޙɺϏδωεΛΔͨΊʹԽֶϝʔΧʔͷσϡϙϯͱ
ϑʔυςοΫܥελʔτΞοϓͰӦۀͱϚʔέςΟϯάΛܦݧɻ ΞϓϦͷͷͨΊʹσʔλαΠΤϯε͕ඞཁͩͱײ͡ɺΞϓϦʹ ಛԽͨ͠ϢʔβʔͷߦಈੳπʔϧΛ։ൃ͢ΔاۀʹͯɺΞϓϦۀք ͷKPIੳͳͲΛ୲͢Δɻ ݱࡏExploratory, Inc. ͰΧελϚʔαΫηεΛ୲͢ΔΒɺσʔ λͷՄࢹԽͱ୳ࡧతσʔλੳΛઐͱͯ͠σʔλαΠΤϯεͷීٴ ʹऔΓΉɻ @ShirotoTakato
3 • ࣭͝zoomͷνϟοτʹ͝ߘ͍ͩ͘͞ɻ • ηϛφʔͷײʹཱͭใΛTwitterͰϋογϡλάΛ ͚ͭͯπΠʔτΛ͓ئ͍͠·͢ɻ #Exploratoryηϛφʔ Exploratory Hour
Exploratory Hour
• ಉ͡จষͷதͰΘΕΔ୯ޠͷΈ߹ΘͤΛʮάϧʔϓ͝ͱʯʹू ܭ͍ͨ͠ • όʔͱϥΠϯΛΈ߹ΘͤͨνϟʔτΛ࡞Γ͍ͨ ࠓिͷ࣭
• ಉ͡จষͷதͰΘΕΔ୯ޠͷΈ߹ΘͤΛʮάϧʔϓ͝ͱʯʹ ूܭ͍ͨ͠ • όʔͱϥΠϯΛΈ߹ΘͤͨνϟʔτΛ࡞Γ͍ͨ ࠓिͷ࣭
7 Twitter search͔ΒʮσʔλαΠΤϯεʯͷΩʔϫʔυͰऔಘͨ͠πΠʔτ(จ ষ)Λ୯ޠԽͨ͠σʔλ
8 จষΛ୯ޠԽ͢Δ
9 ୯ޠԽͨ͠σʔλΛϫʔυΫϥυͰՄࢹԽ͢Δ
10 ͜ͷํ๏ͰɺΑ͘ΘΕΔ୯ޠՄࢹԽͰ͖Δ͕ɺҰॹʹΘΕ͍ͯΔ୯ޠ Θ͔Βͳ͍ɻ
ಉ͡จষͷதͰҰॹʹΘΕΔ୯ޠͷΈ߹ ΘͤΛΓ͍ͨɻ 11
12 ྫ͑ɺAIͱػցֶशΑ͘ҰॹʹΘΕΔͷͰͳ͍͔ʁ
13 ୯ޠͷΈ߹ΘͤΛ͑Δɻ document_id token count 1 σʔλ 1 1 αΠΤϯε
1 1 ֶश 1 document_id token_x token_y value 1 σʔλ αΠΤϯε 1 1 αΠΤϯε ֶश 1 1 ֶश σʔλ 1
14 ςΩετσʔλͷՃʹ͋Δʮ୯ޠͷΈ߹ΘͤΛΧϯτʯ͔Β࣮ߦͰ͖Δɻ
15 ୯ޠͷΈ߹ΘͤΛ͑ͨσʔλ
16 ୯ޠͷΈ߹ΘͤΛόʔνϟʔτͰՄࢹԽ
17
18 ʮ୯ޠʯͰݕࡧ
σόΠεʹΑͬͯҰॹʹΘΕΔ୯ޠͷ Έ߹Θͤͷʹҧ͍͋Δͷ͔ʁ 19
20 άϧʔϓʢσόΠεʣ͝ͱʹ୯ޠͷΈ߹ΘͤͷΛूܭ͢Δɻ device token_x token_y value mobile σʔλ αΠΤϯε 10
mobile σʔλ ߴߍੜ 6 mobile ߴߍੜ ߨٛ 5 mobile ڭҭ σʔλ 5 pc σʔλ αΠΤϯε 8 pc σʔλ ࣾձਓ 6 pc ࣾձਓ ߨ࠲ 5 pc େֶ ࣾձਓ 4
21 ݩʑͷσʔλʹdeviceͷྻ͕͋Δɻ
22 ͔͠͠ɺ୯ޠԽͨ͠ࡍʹଞͷྻ͕ফ͑ͯ͠·͍ͬͯΔΑ͏ͩɻ
23 จষΛ୯ޠԽͨ͠εςοϓͷτʔΫϯΛΫϦοΫ͢Δɻ
24 ଞͷྻΛอ࣋͢Δʹʮ͍ʯΛબ࣮ͯ͠ߦ͢Δɻ
25 ୯ޠԽ͢ΔࡍʹଞͷྻΛ͢͜ͱ͕Ͱ͖ͨɻ
26 ςΩετϖΞΛΧϯτͷεςοϓͷτʔΫϯΛΫϦοΫ͢Δɻ
27 άϧʔϓԽ͢ΔྻʹʮdeviceʯΛબ࣮ͯ͠ߦ͢Δɻ
28 device͝ͱʹ୯ޠͷΈ߹ΘͤΛٻΊΔ͜ͱ͕Ͱ͖ͨɻ
29 όʔνϟʔτͷ܁Γฦ͠ʹʮdeviceʯΛબ͢Δɻ
30 mobileͷϢʔβʔঁࢠɺ౦ژɺதߴɺڭ͑Δͱ͍ͬͨ୯ޠ͕ΘΕ͓ͯΓɺ pcϢʔβʔͰɺAIɺେࡕɺۀɺߨ࠲ͱ͍ͬͨ୯ޠ͕ΘΕ͍ͯΔɻ
31 TwitterΛݟͯΈΔͱɺ౦ژঁࢠֶԂͱ͍͏ֶߍͰதߴੜʹσʔλαΠΤϯεΛڭ͍͑ͯΔͷ ͱɺେࡕۀେֶͰࣾձਓ͚ͷσʔλαΠΤϯεߨ࠲͕։ߨ͞ΕͨΑ͏ͩɻ
࣍ճηϛφʔ
EXPLORATORY ΦϯϥΠϯɾηϛφʔ #41 ͳͥExcelϢʔβʔ ExploratoryΛ͏͖ͳͷ͔
None
35
None
2݄ΦϯϥΠϯ։࠵ʂ ฏ൛: 2݄2(Ր), 3(ਫ), 4()
None
• ϏδωεͰ͑Δࢥߟྗͷҭ σʔλαΠΤϯεͷεΩϧशಘ͚ͩͰͳ͘ɺσʔλΛͬͨΑΓΑ͍ҙࢥܾఆΛߦ͏ͨ Ίʹඞཁͳ౷ܭతɾ֬తࢥߟྗशಘͰ͖Δɻ • ݱͰ͑ΔεΩϧͷशಘ ڭࣨͷத͚ͩͰ௨༻͢ΔཧΑΓɺ࣮ࡍͷϏδωεͷݱͰͷΛղܾ͢ΔͨΊʹ ͑ΔεΩϧͷशಘʹॏ৺Λ͓͍ͨτϨʔχϯάɻ • ϓϩάϥϛϯάͳ͠
RݴޠͷUIͰ͋ΔExploratoryΛੳπʔϧͱͯ͠༻͢ΔͨΊɺࢥߟྗͱσʔλαΠΤϯ εͷख๏ͷशಘʹ100ˋूதͰ͖Δɻ ಛ
σʔλϥϯάϦϯάɾτϨʔχϯά 2݄։࠵ʂ EXPLORATORY
2݄ΦϯϥΠϯ։࠵ʂ ฏ൛: 2݄18(),19(ۚ)
None
Q & A
Contact Email
[email protected]
Twitter Hashtag #ExploratoryHour ͰπΠʔτʂ Twitter @ExploratoryJp Exploratory
Hour https://bit.ly/30odd9q
EXPLORATORY