Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
一休.com を支えるデータ分析基盤
Search
yusuke sasajima
August 17, 2017
Science
6.3k
3
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
一休.com を支えるデータ分析基盤
yusuke sasajima
August 17, 2017
More Decks by yusuke sasajima
See All by yusuke sasajima
一休.comにおけるfrontend開発
zimathon
3
1.3k
SQLアンチパターン勉強会 #2
zimathon
0
390
Other Decks in Science
See All in Science
(CVPR2026) Back to Basics: Let Denoising Generative Models Denoise
shumpei777
0
170
1. CPC理論の展開と集合的知能モデル(JSAI2026 KS-27 集合的予測符号化と新たな知性の時代)
hayashiyus884
1
210
Cross-Media Technologies, Information Science and Human-Information Interaction
signer
PRO
3
32k
How we plan to publish 1,000 bio-logging datasets to GBIF and OBIS
peterdesmet
0
110
Bリーグのショットデータを活用した得点期待値モデルの構築 / Construction of expected points model using shot data of B.LEAGUE
konakalab
0
150
(2025) Balade en cyclotomie
mansuy
0
630
人生を変えた一冊「独学大全」のはなし / Self-study ENCYCLOPEDIA: The Book Which Change My Life #独学大全 #EM推し本
expajp
0
160
俺たちは本当に分かり合えるのか? ~ PdMとスクラムチームの “ずれ” を科学する
bonotake
2
2.4k
「遂行理論の未来」(松島斉教授最終講義記念セッションの発表資料)
shunyanoda
0
920
機械学習 - DBSCAN
trycycle
PRO
0
1.9k
機械学習 - 決定木からはじめる機械学習
trycycle
PRO
0
1.5k
チュートリアル:世界モデル
hf149
0
1.8k
Featured
See All Featured
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
72
40k
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
210
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Abbi's Birthday
coloredviolet
3
8.2k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
2
1.5k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.5k
Optimizing for Happiness
mojombo
378
71k
Code Reviewing Like a Champion
maltzj
528
40k
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
740
Writing Fast Ruby
sferik
630
63k
Transcript
ҰٳDPNΛࢧ͑Δ σʔλੳج൫ ౡ༞հ
σʔλੳج൫ڥͷ࠶ߏங
࠶ߏஙલͷσʔλੳج൫ʢࣾͷωοτϫʔΫʹߏஙʣ 基幹DB セッションログ (行動ログ) GA + BigQuery 統合データ (DWH) データ分析
様々なデータソース 統合されたデータ (社内NW) 抽出 CRM施策 (オフライン) データサイエンティスト、 マーケ、エンジニア メール配信 (ごぶさたクーポン) ETL メール配信 (Price down通知)
Ҡߦͷഎܠ • ຊ൪ڥͱࣾͷੳڥͷωοτϫʔΫஅ͞Ε͍ͯΔ – ݱߦͷੳڥʢ42-4FSWFSʣࣾڥʹߏங͞Ε͍ͯΔ – அ͞Ε͍ͯΔ͜ͱʹΑΔ͞·͟·ͳ੍͕ൃੜ͍ͯͨ͠ • ຊ൪ڥͷ%#͞·͟·ͳ߹ʹΑΓҰҰճ͔͠&5-Ͱ͖ͳ͍ •
σΟεΫ༰ྔෆ – ރׇ͢ΔՄೳੑ͕ৗʹ͋Δ • ͜ͷαʔόʹෆ۩߹͕ى͖ΔͱʑͷϚʔέςΟϯάࢪࡦ͕ࢭ·ͬͯ͠·͏ͱ͍ ͏ڪා h"p://localhost:3000/api/campaign/
σʔλੳج൫Ϋϥυڥ 基幹DB セッションログ (行動ログ) 統合データ (DWH) データ分析 様々なデータソース 統合されたデータ 抽出
CRM施策 (オフライン) データサイエンティスト、 マーケ、エンジニア ETL クラウド環境に移⾏ ログ基盤を内製 メール配信 (ごぶさたクーポン) メール配信 (Price down通知)
3FETIJGU্ʹߏங࣮͠ࡍʹࢼͯ͠Βͬͨͱ͜Ζʜ 基幹DB セッションログ (行動ログ) 統合データ (DWH) データ分析 様々なデータソース 統合されたデータ (クラウド)
抽出 CRM施策 (オフライン) データサイエンティスト、 マーケ、エンジニア ETL ・今の環境からの移行が大変そう ・移行するだけなら効果が出ない ・慣れた道具をわざわざ変えるのは… メール配信 (ごぶさたクーポン) メール配信 (Price down通知)
%BUB8BSFIPVTFͱͯ͠ར༻͢ΔαʔϏεͷํస Redshift → Azure SQL Data Warehouse • ར༻͢Δ͖αʔϏεΛ࠶બఆ –
ੳڥ͔ΒͷҠߦίετ͕ߴ͍ • 3FETIJGU1PTUHSF42-͕ϕʔε • "[VSF42-%BUB8BSFIPVTF42-4FSWFS͕ϕʔε – 3FETIJGUʹҠߦ͢Δ߹ɺݱߦͷ42-4FSWFSϕʔεͰͷσʔλੳ༻εΫϦϓτͷ΄ͱΜͲ શͯΛॻ͖͢ඞཁ͕͋Δʢ"[VSF42-%BUB8BSFIPVTFͰҰ෦ॻ͖͢ඞཁ͋Δʣ – ͔͠͠ɺطଘࢿ࢈ͷ΄ͱΜͲ͕ͯ͢ྲྀ༻Մೳ • ҠߦίετؑΈͨஅ͕ඞཁͩͬͨ – Ұٳͷຊ൪ڥશ໘తʹ"84ͷҠߦΛਐΊ͓ͯΓɺͦͷจ຺͔Β 3FETIJGUʹҠߦ͖͢ͱஅͯ͠͠·ͬͨ
৽σʔλੳج൫"[VSF42-%BUB8BSFIPVTFΛத৺ͱͨ͠ ͷʹ 基幹DB セッションログ (行動ログ) 統合データ (DWH) データ分析 様々なデータソース 統合されたデータ
(クラウド) 抽出 CRM施策 (オフライン) データサイエンティスト、 マーケ、エンジニア ETL メール配信 (ごぶさたクーポン) メール配信 (Price down通知)
ҰٳDPNͷϩάج൫ɺσʔλੳج൫
ϩάج൫
ϩάج൫ʹΑͬͯηογϣϯϩάʢߦಈϩάʣΛੵ 基幹DB セッションログ (行動ログ) 統合データ (DWH) データ分析 様々なデータソース 統合されたデータ (クラウド)
抽出 CRM施策 (オフライン) データサイエンティスト、 マーケ、エンジニア ETL メール配信 (ごぶさたクーポン) メール配信 (Price down通知)
ϩάج൫ͷશମ૾
ϩάૹ৴ઌͱͳΔ"1*ͷΞʔΩςΫνϟ AjaxでH"pRequest
ੑೳΛݕূͨ݁͠Ռ(PͰ࣮ΛਐΊ·ͨ͠ 当初は API Gateway + Lambda の想定
ߏ UTNBMM ʹͯ҆ఆՔಇத
ϩάूΞʔΩςΫνϟ Kinesis Stream を利⽤
,JOFTJTͱ-BNCEBͷ૬ੑൈ܈ • ૬ੑ͕ྑ͍ཧ༝ – σʔλར༻ઌ͕૿͑ͨ߹-BNCEBଆͰΠϕϯτΛొ͢Δ͚ͩ – Τϥʔ͕ൃੜͨ͠߹ʹσʔλͷ༗ޮظݶ·ͰϦτϥΠ͢Δ
σʔλੳج൫
σʔλੳج൫ͷશମ૾
ॳͷϓϥϯ
"[VSFͷڥʹΑΔ੍͕ݪҼ • "[VSF42-%BUB8BSFIPVTFͰඞཁͳσʔλՃॲཧ͕୯ମͰ ࣮ࢪͰ͖ͳ͍ – +40/Λύʔε͢Δॲཧ͕ॻ͚ͳ͍ɺਖ਼نදݱΛར༻ͨ͠ॲཧ͕ॻ͚ͳ ͍ • ͭ·Γɺੜσʔλͦͷ··Ͱར༻ෆՄ –
"[VSF42-%BUB8BSFIPVTFʹσʔλΛೖ͢ΔલʹՃ͢Δॲཧ͕ ඞཁʹͳΔ • େྔϑΝΠϧͷσʔλϩʔυੑೳ – ͞·͟·ͳߏΛࢼͨ݁͠Ռɺݱঢ়ͷߏ͕࠷ద • $MPVE4UPSBHF্ͷࡉԽ͞ΕͨϩάใΛ#JH2VFSZʹҰ୴ू͢Δ – $MPVE4UPSBHF͔Β"[VSF42-%BUB8BSFIPVTF·Ͱ
#JH2VFSZϩάΛՃͱू͢ΔׂΛ࣋ͭ
σʔλੳج൫ͷ׆༻ࣄྫ
۩ମతͳ׆༻ࣄྫ • ,1*ूܭ – ࣄۀͷ,1*ͱͳ͍ͬͯΔࢦඪͷࢉग़ • ๚ɺ$73 • ৽نձһొϦϐʔτɺϦϐʔλʔຖͷച্ •
νϟωϧຖͷച্ • $3.ࢪࡦ – ϝʔϧΛར༻ͨ͠UPϚʔέςΟϯά
,1*ूܭ
ϝʔϧΛར༻ͨ͠UPϚʔέςΟϯάʢ͝Ϳͨ͞Ϋʔϙϯʣ
ϝʔϧΛར༻ͨ͠UPϚʔέςΟϯάʢ1SJDFEPXO௨ʣ
σʔλੳج൫ɾϩάج൫ͷࠓޙͷ׆༻
ηογϣϯϕʔεͰͷސ٬ͱͷίϛϡχέʔγϣϯྫ 前回のセッションの行動か ら予約の再検討を提案
ϩάج൫ΛԽͨ͠ཧ༝ • ϢʔβʔͷߦಈϩάΛՄೳͳݶΓૣ͘ऩू͢Δҝ – ηογϣϯىͰͷϢʔβʔߦಈΛิͯ͠ϦΞϧλΠϜͳࢪࡦΛଧ ͍ͪͨ – Google Analytics +
BigQueryの構成では解決できない問題があった • σʔλੵͷλΠϜϥάʢ࠷Ͱ࣌ؒޙʣ • ͦͦΞϓϦέʔγϣϯαʔό͔Βੵ͞Εͨσʔλ͕ӾཡͰ͖ͳ͍ 自分たちでコントロールできる Google Analy>cs + BigQueryのようなものが必要
ϦΞϧλΠϜߦಈϩάͷऩू
ΧελϚʔδϟʔχʔ૬ͷσʔλ͕ϦΞϧλΠϜʹར༻Մೳ Ϣʔβʔͷηογϣϯ୯ҐͰͷߦಈϩά͕ϦΞϧλΠϜʹੵɾߋ৽͞ΕΔ 初回と最終の 訪問日時と訪 問URLを保持 ユーザーが対 象の画面を通っ たかどうかをフ ラグで管理 サイトに滞在し
た時間
·ͱΊ • Ұٳʹ͓͚Δσʔλੳج൫ͷ࠶ߏஙʹ͓͚Δϩάج൫ɺσʔλ ੳج൫ʹ͍͖ؔͯͤͯͨͩ͠͞·ͨ͠ • ࠶ߏங࣌ݱߦۀσʔλྔɺσʔλੳج൫ʹؔΘΔཁૉΛ ͖ͪΜͱੳͯ͠ਐΊΔ͖ͩͱ࠶ೝࣝ͠·ͨ͠ • ࠓޙϚʔέςΟϯάࢪࡦͷىΛશͯ৽͍͠σʔλੳج൫ ʢ"[VSF42-%BUB8BSFIPVTFʣʹҠߦ͍͖ͯ͠·͢