ゼロから構築！6年間で1,760%成長した「いい部屋ネット」を支えるデータ分析基盤

ゼロから構築！ 6年間で1,760%成長した「いい部屋ネット」を支えるデータ分析基盤 Data Engineering Summit ~生成AI時代のデータ基盤構築~

自己紹介 2 杉山隆(Takashi Sugiyama) 株式会社Red Frasco データエンジニア趣味: バスケットボール

Red Frascoについて 3 Web広告 SEOコンサルシステム開発＋＋不動産業界に特化、クライアント自社HP集客を全面的にサポート

Red Frascoの強み 4 開発・集客(SEO/Paid Ads)・データを組み合わせて成果を最大化有料流入 (Paid Ads) 無料流入 (SEO)
反響数流入 × = + CVR (サイト品質) データ分析基盤データフィード連携、コストモニタリングなど物件数モニタリング順位モニタリングなどモニタリング各種レコメンド施策コンテンツの生成など

5 本日話すこと

いい部屋ネットとは 6 大東建託パートナーズが運営する賃貸物件をお探しの方向けの不動産ポータルサイト

7 お問い合わせ数最大 1,760% 2025年9月時点 ★2020年04月プロジェクト開始

プロダクトを改善するうえでの前提 8 1発のホームランを狙うのではなく、何度も打席に立つことが重要改善目標ライン改善目標ラインホームランを狙う効果時間 ★途中効果が悪くなったとしてもすぐに方向性を転換
数週間〜数ヶ月の開発効果時間不確実性打席に立つ回数を増やす

プロダクト改善とデータ分析基盤の関係 9 データ分析基盤 PLAN 機能・開発の優先順位決定 DO 小さな開発 &
リリース CHECK 検証 & 評価 DO 全体リリース & 再評価検証設計定量データから注力箇所・課題箇所の特定改善結果の評価得られた知見の収集効果検証の評価全体インパクトの試算何度も打席に立つためには、各フェイズでデータ分析基盤が必要不可欠

本プロジェクト開始前の状況 10 データ分析環境がない、ゼロからのスタート

本日話すこと 11 いい部屋ネットの成長を加速するために、データエンジニアは何をしてきたのか、 5年間の軌跡をステップに分けて説明します STEP 01 STEP 02 STEP 03
プロダクトのゴール設定現状把握と課題特定。プロダクトのKPI を定め、改善サイクルの前提準備データ意思決定文化の定着化プロジェクトメンバ全体が同じ目線で会話できる環境を構築データを用いたプロダクト改善データを活用し、プロダクトに対して改善施策の実施

スモールスタートで道を切り拓く 12 早く無駄無く効果実感 • プロダクト改善をするうえでデータ意思決定文化の早期定着化が必須 • 一度に全ての機能を作ろうとすると軌道修正がしづらい、小回りが効かない →拡張性を意識したうえで、必要な機能・必要なデータ収集のみを実施
• データ組織はコストセンターになりやすい →早期に少しずつ成果を出しながら効果実感をしてもらう 1 2 3 データ意思決定文化の定着化が急務手戻りのリスクを避け、早期に成果を出すために小さくスタート

導入から現在までの道のりスモールスタートで構築し、組織の成長に併せて段階的に機能を追加することに STEP 01 STEP 02 STEP 03 プロダクトのゴール設定
現状把握と課題特定。プロダクトのKPI を定め、改善サイクルの前提準備 • データ精査 • データ品質改善 • 最小限のデータ収集 • KPI設定データ意思決定文化の定着化プロジェクトメンバ全体が同じ目線で会話できる環境を構築 • 施策毎の最小限のデータ収集 • ダッシュボード構築 • プロダクト向け • マーケ向け • データ監視データを用いたプロダクト改善データを活用し、プロダクトに対して改善施策の実施 • データ活用 • バッチによるレコメンド • リアルタイムによるレコメンド • コンテンツ • IaC+CI/CD整備 13

STEP 01: 最小限でのデータ分析基盤 14 まずは、サイトの現状分析+KPI設定が行える環境の準備が急務データ分析基盤はスモールスタートで構築ポイント構成図収集するデータ・環境選定 •
最低限のデータからアドホック分析を通じてプロダクトの現状分析とKPI設定が必要将来の拡張性 • 将来、データの種類が増加することを想定する必要があるアプリケーションシステムデータ Cloud Storage VPC Network Cloud Composer BigQuery

STEP 01: この時点でのデータ分析基盤の構成 15

STEP 02: データ起点の意思決定の範囲を拡大 16 KPIの設定や改善のためデータ準備が完了したので、データの活用を適用範囲をプロジェクト全体に拡大 STEP 01 STEP 02
STEP 03 プロダクトのゴール設定現状把握と課題特定。プロダクトのKPI を定め、改善サイクルの前提準備 • データ精査 • データ品質改善 • 最小限のデータ収集 • KPI設定データ意思決定文化の定着化プロジェクトメンバ全体が同じ目線で会話できる環境を構築 • 施策毎の最小限のデータ収集 • ダッシュボード構築 • プロダクト向け • マーケ向け • データ監視データを用いたプロダクト改善データを活用し、プロダクトに対して改善施策の実施 • データ活用 • バッチによるレコメンド • リアルタイムによるレコメンド • コンテンツ • IaC+CI/CD整備

STEP 02: 適用範囲の拡大にむけた方針 17 場所環境データ起点の意思決定の文化を定着化させるために、目線を合わせる “環境”と“場所”を提供ゴール •
プロジェクトメンバーが、共通でデータを確認できる基盤 → 改善に必要なデータの追加とダッシュボードの構築 • 定期的にデータを確認し、データによる意思決定を習慣化 → プロジェクト全体でデータを確認、議論できる会議体の開催 • プロジェクト全体が、データを起点にした意思決定を実施

STEP 02: 定着化に向けた役割分担 18 データチーム内で分担し、定着化に着手場所データアナリスト主導 • KPI進捗定例会 •
KPIのモニタリングからの課題抽出 • プロダクト全体定例会 • プロダクト課題のチーム間連携 • 課題に対するデータ分析結果の共有 • マーケティング定例会 • プロダクトのCVベースの広告評価環境データエンジニア主導 • プロダクト外のデータ連携の強化 • Web広告データ • SEOデータ • CRMデータ • ダッシュボードの構築 • KPI指標のモニタリング • 各チーム向けダッシュボード

STEP 02: 定着化に向けた役割分担 19 データチーム内で分担し、定着化に着手場所データアナリスト主導 • KPI進捗定例会 •
KPIのモニタリングからの課題抽出 • プロダクト全体定例会 • プロダクト課題のチーム間連携 • 課題に対するデータ分析結果の共有 • マーケティング定例会 • プロダクトのCVベースの広告評価環境データエンジニア主導 • プロダクト外のデータ連携の強化 • Web広告データ • SEOデータ • CRMデータ • ダッシュボードの構築 • KPI指標のモニタリング • 各チーム向けダッシュボード

STEP 02: ダッシュボードもスモールスタート 20 リッチなダッシュボードよりも、意思決定に必要な情報の提供と監視/運用を意識 • ダッシュボード構築 • ダッシュボードの描画は必要最低限 •
セキュリティ対策 • GKEによる運用負担の軽減 • 監視/運用 • KPI含めた重要指標の低下の検知 • サーバーレスにでコスト最小限にポイント監視機能ダッシュボード環境各種システム構成

STEP 02: やっぱり、サービスレベルあがると大変 21 定着化は進んだものの、他チームへのデータ提供により、サービスレベルがあがり、思った以上に運用が大変に… • アクセス管理の複雑化 • チーム/アカウントごとにアクセス可能な
データセットを分けていたが、この頃は手作業で管理していたため、管理が複雑に… • 監視 • 問題ない場合が多く、オオカミ少年化 • 閾値の調整を何度か行った監視通知の例

STEP 02: プロダクトの改善スピートアップに貢献 22 “環境”と“場所”の提供により、ダッシュボードを利用した意思決定が定着チームを跨いだ施策も実施され、プロダクトの改善も加速 KPI改善 ✓ ダッシュボードをベースにした会議の実施 ✓
ダッシュボードを利用した課題抽出施策実施 ✓ 定量的な数値による施策評価 ✓ Webマーケ x 開発などのチーム間をまたいだ施策の実施プロジェクトの変化 KPIの成長は年々加速プロダクトの変化

STEP 02: (余談)ダッシュボードはリッチになりました 23 各チームのデータ利用が活発化し、ビジュアライズの要件も増加現在は、ダッシュボードをTableauに移行中初期構築時現在

STEP 02: この時点でのデータ分析基盤の構成 24

STEP 03: データを用いたプロダクト改善を実施 25 UI改善が一段落したことにより、データを活用した施策を実施 Before After

STEP 03: データを用いたプロダクト改善を実施 26 プロダクトにデータを用いた施策を複数行ったが、その中の一例である、物件のレコメンド機能の取り組みを紹介する STEP 01 STEP 02
STEP 03 プロダクトのゴール設定現状把握と課題特定。プロダクトのKPI を定め、改善サイクルの前提準備 • データ精査 • データ品質改善 • 最小限のデータ収集 • KPI設定データ意思決定文化の定着化プロジェクトメンバ全体が同じ目線で会話できる環境を構築 • 施策毎の最小限のデータ収集 • ダッシュボード構築 • プロダクト向け • マーケ向け • データ監視データを用いたプロダクト改善データを活用し、プロダクトに対して改善施策の実施 • データ活用 • バッチによるレコメンド • リアルタイムによるレコメンド • コンテンツ • IaC+CI/CD整備

STEP 03: 賃貸情報サイトのデータ特性 27 賃貸情報サイトは、物件/ユーザーどちらも他の商材とは異なるユニークな特性あり • すべての商品の在庫が1つ • 入居者が退去するまで、在庫は復活しない →
商品の移り変わりが激しい • 検討期間が短く、訪問回数が少ない • 入居が決まれば、年単位で再訪がない → ユーザー接点が短期的で行動データが蓄積しにくい 80%超のユーザーが2回まで訪問訪問回数 1回 2回 3回以上物件の掲載期間 -10日 -20日 -30日 -60日 -90日 90日~ 60%超の物件が30日で掲載終了物件データユーザーデータ 32% 17% 12%

STEP 03: レコメンド機能の検討 28 ユーザー/物件ともにコールドスタート問題への対応が必須コスト観点から#1にて実施 # 対応案データ連携期待される効果
実装にかかるコスト 1 物件データでレコメンドモデルを作成する、ユーザーの行動ログは使用しないバッチ or リアルタイム中中 2 ユーザーの行動ログをリアルタイムに取得・分析するリアルタイムのみ大特大

STEP 03: 実際のレコメンド画面 29 トップ検索物件一覧物件詳細フォームレコメンドパーツ

STEP 03: レコメンドロジック 30 物件データをベクトル化し、物件間の距離が近いものをレコメンド特に近い要素を推薦理由として表示し、ユーザーへの伝わりやすさを意識物件A # 物件推薦理由
1 物件B 面積がより広い 2 物件C 立地が近い 3 物件F 築年数がより浅い 4 物件H 家賃がより近い 5 物件O 同じ市区町村 ... 物件A 物件B ベクトル化 (a1 , a2 , ..., an ) (b1 , b2 , ..., bn ) 距離を計算ベクトル化推薦理由推薦物件ロジックイメージレコメンドイメージ

STEP 03: 計算時間短縮の活動 31 いくつかの対策を行うことで計算時間を短縮することに成功 1. 計算対象レコードの削減 • 同じ都道府県の物件であること •
10km圏内の物件であること 2. 並行処理 • 都道府県単位で1.の処理を並行して実施 3. 処理を行う基盤 • 当初はBigQueryでは実行していたが、処理が遅いため Dataproc上でApach Sparkを動かすように変更計算時間短縮のための工夫短縮結果 2時間東京都だけで全都道府県で 1時間

STEP 03: システム構成 32 2. 物件データを取得 3. おすすめ物件の算出 4. CSVファイルで出力
5. アプリケーションの BEがデータを取得 1. 物件データが連携されたら即実行まずは単純なバッチ処理で構成

STEP 03: レコメンドの導入結果 33 本施策により物件の閲覧数が+17%となり、レコメンドの有効性を確認また、適応面をサンクスメールにも拡大し、CV数の増加に寄与物件閲覧数 + 17 %
CVユーザー + 16 % 詳細画面レコメンドの効果サンクスメールレコメンドの効果

STEP 03: 施策深度の進化 34 リアルタイムレコメンドに着手対応案データ連携期待される効果実装にかかるコスト 1
物件データでレコメンドモデルを作成する、ユーザーの行動ログは使用しないバッチ or リアルタイム中中 2 ユーザーの行動ログをリアルタイムに取得・分析するリアルタイムのみ大特大実施済

STEP 03: リアルタイムレコメンドに必要な要素 35 データ取得データ返却 • ユーザーのリアルタイム行動ログ、及びログを取得するシステム • システムはアプリケーションと密に連携するため、UXに悪影響を
与えないようにする • 算出したおすすめ物件をアプリケーションに連携するシステム • データ取得を行うシステムと同様、UXに悪影響を与えないようにする 1 2 予測モデル • 行動ログを分析し、おすすめ物件を算出するモデル 3 1 2 3

STEP 03: APIの注力ポイント 36 ①データ取得と②データ返却のために、APIを構築 UXに悪影響を与えないよう、リクエストレイテンシーの向上に注力プログラミング言語の選定当初Pythonで記述していたが、思った通りのレイテンシーが出なくGo言語に書き換えたデータの保存場所には、コストや拡張性、インフラ管理が容易…等の理由から当初はFirestoreを使用していたが、大規模なトランザクションに対応するためBigtableに変更した
データベースの選定

STEP 03: ①データ取得 37 システム構成図 VPC Network Cloud Run Bigtable
Cloud Armor Pub/Sub Dataflow BigQuery Cloud Load Balancing API Gateway 1. 2. 3. # サービス説明 1 Cloud Run APIの実行環境。オートスケーリング機能、サーバーレスによるインフラ管理工数の削減…いったメリットがある 2 Bigtable レコメンド提供時に使用するデータを格納 3 Pub/Sub Dataflow BigQuery 将来的に分析に使うことも考慮し、 BigQueryにもデータを保存利用しているサービスについて

STEP 03: ②データ返却 38 VPC Network Cloud Run Bigtable Cloud
Armor Vertex AI Cloud Load Balancing API Gateway 1. # サービス説明 1 Vertex AI Bigtable Bigtableから取得した行動ログをもとに、 Vertex AI上のモデルからおすすめ物件を取得システム構成図利用しているサービスについて

STEP 03: 予測モデル 39 モデルは、Googleが開発したレコメンデーションシステム構築のための TensorFlow向けライブラリである TensorFlow Recommendersを使用 TFRSでは、推薦タスクを大きく2つに分けてモデル化 Retrievalで絞り込まれた候補の中から、
最も適した順に並び替えるユーザーとアイテムを共通の埋め込み、空間にマッピングし、「どのアイテムがこのユーザーに合いそうか」を高速に検索 Retrieval 1 2 3 1. Retrieval(検索)モデル 2. Ranking(ランキング)モデル Ranking

STEP 03: リアルタイムレコメンドの導入結果 40 懸念点であったAPIのリクエストレイテンシーは、目標値を大幅に下回る結果となったリアルタイムレコメンドの効果でCV数が5.6%アップリアルタイムレコメンドの効果リクエストのレイテンシー実測値 20ミリ秒以内
(99パーセンタイル値) 1秒以内目標値 CV数 + 5.6 %

STEP 03: IaC+CI/CD 41 分析基盤構築が落ち着いたこのタイミングで実施 IaC • Terraformを使用 • 既存のリソースから、gcloudコマンド
やTerraformer等を用いてHCLコードにエクスポート CI/CD • GitHub Actionsを使用 • GitHubを使っているからという単純な理由反省点整備に1人/月ほど掛かったので、なるべく早い段階で導入しておくべき (分析基盤構築をミニマムでやっていたので、なかなか着手できなかった…) (遅くともSTEP 01の後くらいにやるべきでした)

STEP 03: データ分析基盤の現在の構成 42

STEPごとのまとめ 43 STEP 01: プロダクトのゴール設定 ✓ データ意思決定文化の定着のため、最小限のデータ収集とゴール設定を行う ✓ 将来の拡張性を考慮し、アドホック分析環境ができる環境の構築(BigQuery +
Cloud Composer) STEP 02: データ意思決定文化の定着化 ✓ データの提供だけでなく、データを確認・判断する機会を同時に提供する ✓ ただのデータ可視化だけでなく、データの監視と通知ができる環境の構築 STEP 03: データを用いたプロダクト改善 ✓ まずはバッチ処理のレコメンドから始め、効果が確認できたらリアルタイム処理を実装 ✓ APIはUXを考慮し、リクエストレイテンシーを最小化

まとめ 44 いい部屋ネットの成長を加速するために、データ組織は何をしてきたのかプロジェクトに関わる全メンバーのデータに基づく意思決定の文化定着蓄積したデータを活用したプロダクトへのデータ活用のチャレンジ 1 2

45 お問い合わせ数最大 1,760% 2025年9月時点 ★2020年04月プロジェクト開始

まとめ 46 適切なタイミングで適切な施策をリリースすることが重要早く、無駄無く、効果実感を意識データ分析基盤を構築する上で意識したことスモールスタートプロダクト状況の把握 1 2

集客今後の展望 47 データ施策の適応面を広げつつ、既存施策の効果を並行して高めていくプロダクトにインパクトを与える改善施策を推進していく入稿システム (他社製品) 入稿システム (自社製品) データ変換
いい部屋ネット有料集客 (Paid Ads) 無料集客 (SEO+メールなど) CRM トップ検索物件一覧物件ライブラリ店舗詳細本日お話をしたレコメンドの適応面実施済の適応面本日お話した適応面 ▼判例物件詳細フォーム

今後の展望 48 プロダクト改善のみに限らず、ビジネスデータを収集して、ビジネス全体にも価値をもたらしたい現在今後

WE ARE HIRING!! 一緒に働く仲間を募集中です！まずは採用ページを見てください！！ Red Frasco 採用

THANK YOU FOR YOUR ATTENTION!!

ゼロから構築！6年間で1,760%成長した「いい部屋ネット」を支えるデータ分析基盤

ゼロから構築！6年間で1,760%成長した「いい部屋ネット」を支えるデータ分析基盤

More Decks by Red Frasco

Other Decks in Technology

Featured

Transcript