Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
不動産情報サイトにおけるリアルタイムデータ分析基盤の活用
Search
Red Frasco
December 07, 2023
Technology
1
320
不動産情報サイトにおけるリアルタイムデータ分析基盤の活用
2023/12/07 に開催された Jagu'e'r(Japan Google Cloud Usergroup for Enterprise)データ利活用分科会 LT 大会の登壇資料です。
Red Frasco
December 07, 2023
Tweet
Share
More Decks by Red Frasco
See All by Red Frasco
レガシーで硬直したテーブル設計から変更容易で柔軟なテーブル設計にする
red_frasco
4
710
5年間のDB技術選定・運用を振り返る Aurora MySQL, RDS MySQL, RDS PostgreSQL が混在した理由と今後の展望
red_frasco
0
35
ゼロから構築!6年間で1,760%成長した「いい部屋ネット」を支えるデータ分析基盤
red_frasco
0
48
“後発優位”で挑んだ 「いい部屋ネット」再構築: 4年間のAWS移行で実現した成果とその舞台裏
red_frasco
0
2k
Datadog Synthetics 活用事例紹介
red_frasco
0
520
バッチ処理が終わらない!? -処理時間を90%削減した話-
red_frasco
1
370
不動産情報サイトにおけるデータ収集で頑張ったこと
red_frasco
0
330
コストに関するヒヤリハットのお話 ~コスト超過で手遅れにならないためにすべきこと~
red_frasco
0
500
Spring Boot 2 から 3 へバージョンアップしてみた
red_frasco
4
17k
Other Decks in Technology
See All in Technology
レガシーシステム刷新における TypeSpec スキーマ駆動開発のすゝめ
tsukuha
4
890
Eight Engineering Unit 紹介資料
sansan33
PRO
0
5.7k
インフラ屋さんはAIコーディングエージェントとどう生きるか/How infrastructure engineers interact with Kiro
ozawa
2
110
Flutter Thread Merge - Flutter Tokyo #11
itsmedreamwalker
1
130
2025 DORA Reportから読み解く!AIが映し出す、成果を出し続ける組織の共通点 #開発生産性_findy
takabow
2
950
MySQL AIとMySQL Studioを使ってみよう
ikomachi226
0
130
MCP・A2A概要 〜Google Cloudで構築するなら〜
shukob
0
120
IPv6-mostly field report from RubyKaigi 2026
sorah
0
250
IaC を使いたくないけどポリシー管理をどうにかしたい
kazzpapa3
1
210
Multimodal AI Driving Solutions to Societal Challenges
keio_smilab
PRO
1
110
useEffectってなんで非推奨みたいなこと言われてるの?
maguroalternative
9
6.1k
「え?!それ今ではHTMLだけでできるの!?」驚きの進化を遂げたモダンHTML
riyaamemiya
9
3.9k
Featured
See All Featured
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
10
700
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
How STYLIGHT went responsive
nonsquared
100
5.9k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.3k
Become a Pro
speakerdeck
PRO
30
5.7k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
1
70
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
Writing Fast Ruby
sferik
630
62k
Transcript
不動産情報サイトにおける リアルタイムデータ分析基盤の活用 Jagu'e'r データ利活用分科会 LT大会 2023.12.07
目次 1. 自己紹介/弊社紹介 2. 本日話すこと/話さないこと 3. なぜリアルタイムデータが必要なのか 4. 分析基盤のシステム構成 5.
リアルタイムデータの活用方法 6. その他
自己紹介 杉山 隆(Takashi Sugiyama) 3 • 所属 • 株式会社Red Frasco
• 職種 • データエンジニア/MLエンジニア • 技術 • Google Cloud, Python, Golang • よく使うGCPサービス • Cloud Composer, Dataflow, Dataproc, BigQuery, ...
株式会社Red Frasco • https://www.red-frasco.com/ • 不動産業界に特化したプロダクト開発・集客支援を実施 • 今回はとある 賃貸不動産情報サイトのデータ分析基盤 のお話
4
本日話すこと/話さないこと • 話すこと • データ分析基盤内のリアルタイムデータについて • 目的、取得方法、活用方法・・・等 • 話さないこと •
データ分析基盤のその他の仕組み • データパイプライン、DWH、BI・・・等 5
なぜリアルタイムデータが必要なのか(1/2) • 賃貸不動産情報サイトにおけるユーザーの行動パターン • ほとんどのユーザは初回訪問でコンバージョン(Web での問い合わせ 等)する • そのためセッション内での訴求が重要となり、行動ログ等のユーザ データをリアルタイムで取得、さらにセッション内の行動を計測でき
るようにすることが望まれる 6
なぜリアルタイムデータが必要なのか(2/2) • Google アナリティクスでは要件を満たせなかった • BigQuery Export 機能 • エクスポートされるタイミングが遅い(要件定義時は翌日午後)
• 最近早くなってきた(翌日早朝)が、それでも要件を満たしていない • ストリーミングエクスポート機能 • 翌日以降にエクスポートされたレコードと比較すると、2〜3割程度のレコード欠 損がある?(※今回の対象サイトだけかもしれません。ご参考まで。) • 将来的には GA からリアルタイムデータへの移行を検討 • UA → GA4 の移行に伴う作業が大変だった・・・ 7
分析基盤のシステム構成(1/6) 全体構成 8
分析基盤のシステム構成(2/6) 本日話す内容はここ! 9
分析基盤のシステム構成(3/6) 拡大 + 開発中の機能も表示 10
分析基盤のシステム構成(4/6) • ログを取得する仕組みは API で提供 • アプリケーション側に極力手が入らないように • 開発チームとの分離 •
バックエンドは Cloud Run で構築 • 運用が楽! 11
分析基盤のシステム構成(5/6) • ログの保存先は2つ • Cloud Run → Bigtable • ログをすぐに利用したい場合の保存先
• 過去2日分を保存 • Cloud Run → Pub/Sub → Dataflow → BigQuery • 通常利用の保存先 • 過去分全てを保存 12
分析基盤のシステム構成(6/6) • 当初は Bigtable ではなく Firestore を利用していたが 書き込みエラーが多く出たため変更 • エラー原因は結局分からず・・・
• 「500/50/5」ルールはきちんと守っていた・・・はず・・・ 13
リアルタイムデータの活用方法 • レコメンド機能 • ユーザーの行動ログを基にした User-to-Item レコメンド • 直近(同一セッション内)の行動ログを特徴量として使用 •
鋭意開発中! 14
その他 • その他の機能も機会があれば話させてください! もしくは懇親会で! • Embedding を使用した Item-to-Item レコメンド •
Cloud Composer のノウハウ • Redash on GKE・・・等 15
Thanks for listening!