Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
不動産情報サイトにおけるリアルタイムデータ分析基盤の活用
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Red Frasco
December 07, 2023
Technology
1
350
不動産情報サイトにおけるリアルタイムデータ分析基盤の活用
2023/12/07 に開催された Jagu'e'r(Japan Google Cloud Usergroup for Enterprise)データ利活用分科会 LT 大会の登壇資料です。
Red Frasco
December 07, 2023
Tweet
Share
More Decks by Red Frasco
See All by Red Frasco
これってSRE?いい部屋ネットを1,760%成長させた開発とインフラのコラボレーション
red_frasco
0
120
レガシーで硬直したテーブル設計から変更容易で柔軟なテーブル設計にする
red_frasco
9
1.9k
5年間のDB技術選定・運用を振り返る Aurora MySQL, RDS MySQL, RDS PostgreSQL が混在した理由と今後の展望
red_frasco
0
100
ゼロから構築!6年間で1,760%成長した「いい部屋ネット」を支えるデータ分析基盤
red_frasco
0
130
“後発優位”で挑んだ 「いい部屋ネット」再構築: 4年間のAWS移行で実現した成果とその舞台裏
red_frasco
0
3k
Datadog Synthetics 活用事例紹介
red_frasco
0
690
バッチ処理が終わらない!? -処理時間を90%削減した話-
red_frasco
1
410
不動産情報サイトにおけるデータ収集で頑張ったこと
red_frasco
0
360
コストに関するヒヤリハットのお話 ~コスト超過で手遅れにならないためにすべきこと~
red_frasco
0
530
Other Decks in Technology
See All in Technology
インシデント対応入門
grimoh
7
5.5k
マイグレーションガイドに書いてないRiverpod 3移行話
taiju59
0
330
チームメンバー迷わないIaC設計
hayama17
5
3.1k
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
1.1k
男(監査)はつらいよ - Policy as CodeからAIエージェントへ
ken5scal
4
630
1 年間の育休から時短勤務で復帰した私が、 AI を駆使して立ち上がりを早めた話
lycorptech_jp
PRO
0
190
20260222ねこIoTLT ねこIoTLTをふりかえる
poropinai1966
0
300
AIエンジニア Devin と歩む、自律型運用プロセスの構築
a2ito
0
270
バクラクにおける Document Understanding の挑戦:書類の「読取」から「意思決定」へ / document-understanding-in-bakuraku-2026
yuya4
0
160
WBCの解説は生成AIにやらせよう - 生成AIで野球解説者AI Agentを実現する / Baseball Commentator AI Agent for Gemini
shinyorke
PRO
0
300
2026-02-24 月末 Tech Lunch Online #10 Cloud Runのデプロイの課題から考えるアプリとインフラの境界線
masasuzu
0
100
Claude Codeはレガシー移行でどこまで使えるのか?
ak2ie
1
1.1k
Featured
See All Featured
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.7k
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
610
A designer walks into a library…
pauljervisheath
210
24k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
750
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Practical Orchestrator
shlominoach
191
11k
Information Architects: The Missing Link in Design Systems
soysaucechin
0
810
Navigating Weather and Climate Data
rabernat
0
130
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
95
Discover your Explorer Soul
emna__ayadi
2
1.1k
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
170
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
64
Transcript
不動産情報サイトにおける リアルタイムデータ分析基盤の活用 Jagu'e'r データ利活用分科会 LT大会 2023.12.07
目次 1. 自己紹介/弊社紹介 2. 本日話すこと/話さないこと 3. なぜリアルタイムデータが必要なのか 4. 分析基盤のシステム構成 5.
リアルタイムデータの活用方法 6. その他
自己紹介 杉山 隆(Takashi Sugiyama) 3 • 所属 • 株式会社Red Frasco
• 職種 • データエンジニア/MLエンジニア • 技術 • Google Cloud, Python, Golang • よく使うGCPサービス • Cloud Composer, Dataflow, Dataproc, BigQuery, ...
株式会社Red Frasco • https://www.red-frasco.com/ • 不動産業界に特化したプロダクト開発・集客支援を実施 • 今回はとある 賃貸不動産情報サイトのデータ分析基盤 のお話
4
本日話すこと/話さないこと • 話すこと • データ分析基盤内のリアルタイムデータについて • 目的、取得方法、活用方法・・・等 • 話さないこと •
データ分析基盤のその他の仕組み • データパイプライン、DWH、BI・・・等 5
なぜリアルタイムデータが必要なのか(1/2) • 賃貸不動産情報サイトにおけるユーザーの行動パターン • ほとんどのユーザは初回訪問でコンバージョン(Web での問い合わせ 等)する • そのためセッション内での訴求が重要となり、行動ログ等のユーザ データをリアルタイムで取得、さらにセッション内の行動を計測でき
るようにすることが望まれる 6
なぜリアルタイムデータが必要なのか(2/2) • Google アナリティクスでは要件を満たせなかった • BigQuery Export 機能 • エクスポートされるタイミングが遅い(要件定義時は翌日午後)
• 最近早くなってきた(翌日早朝)が、それでも要件を満たしていない • ストリーミングエクスポート機能 • 翌日以降にエクスポートされたレコードと比較すると、2〜3割程度のレコード欠 損がある?(※今回の対象サイトだけかもしれません。ご参考まで。) • 将来的には GA からリアルタイムデータへの移行を検討 • UA → GA4 の移行に伴う作業が大変だった・・・ 7
分析基盤のシステム構成(1/6) 全体構成 8
分析基盤のシステム構成(2/6) 本日話す内容はここ! 9
分析基盤のシステム構成(3/6) 拡大 + 開発中の機能も表示 10
分析基盤のシステム構成(4/6) • ログを取得する仕組みは API で提供 • アプリケーション側に極力手が入らないように • 開発チームとの分離 •
バックエンドは Cloud Run で構築 • 運用が楽! 11
分析基盤のシステム構成(5/6) • ログの保存先は2つ • Cloud Run → Bigtable • ログをすぐに利用したい場合の保存先
• 過去2日分を保存 • Cloud Run → Pub/Sub → Dataflow → BigQuery • 通常利用の保存先 • 過去分全てを保存 12
分析基盤のシステム構成(6/6) • 当初は Bigtable ではなく Firestore を利用していたが 書き込みエラーが多く出たため変更 • エラー原因は結局分からず・・・
• 「500/50/5」ルールはきちんと守っていた・・・はず・・・ 13
リアルタイムデータの活用方法 • レコメンド機能 • ユーザーの行動ログを基にした User-to-Item レコメンド • 直近(同一セッション内)の行動ログを特徴量として使用 •
鋭意開発中! 14
その他 • その他の機能も機会があれば話させてください! もしくは懇親会で! • Embedding を使用した Item-to-Item レコメンド •
Cloud Composer のノウハウ • Redash on GKE・・・等 15
Thanks for listening!