Upgrade to Pro — share decks privately, control downloads, hide ads and more …

TVer の月間ユニークブラウザ数 2700 万のサービスを支える統合ログ基盤の開発

TVer の月間ユニークブラウザ数 2700 万のサービスを支える統合ログ基盤の開発

2023/05/23
Google Cloud Day ’23 Tour

イベントURL :
https://cloudonair.withgoogle.com/events/google-cloud-day-23

TVer Inc.

May 23, 2023
Tweet

More Decks by TVer Inc.

Other Decks in Technology

Transcript

  1. スピーカー自己紹介 • 株式会社TVer (2021/4 ~) ◦ 2020/3 ~ 2021/3は株式会社TVer Technologiesに所属

    • データシステムの開発・運用を担当 • 検索基盤も開発・運用を担当 • 趣味は語学とダンス • 好きなGoogle Cloudのサービス: Cloud Logging のLog Analytics 黒瀬祐平 株式会社TVer プロダクトタスク
  2. 億 1日あたりのログ数 GiB 1日あたりのログサイズ アクセス 1日のピークにおける秒 間同時接続数 920 21,000 11

    • Google Cloudを活用することで、 リリース以後1年以上の期間にお いてTVerTagの安定稼働を実現 TVerTag運用状況 件 ログ欠損発生件数 0
  3. 方式検討 Log Router Cloud Logging Log Storage Cloud Logging Cloud

    Pub/Sub Dataset BigQuery Linked Dataset BigQuery Table BigQuery 参照用Table BigQuery ①BigQuery Subscriptionsを利用する方法 ②Log RouterのSinkにBigQueryを指定する方法 ③Log Analytics('23 1月GA)のLinked Datasetを利用する方法
  4. • Cloud LoggingのログをBigQueryのSQLで集 計できるようにする ◦ '22 9月にサービスPreview, '23 1月 GA

    • Log Analyticsを有効化したLog BucketをLog RouterのSinkに指定することで利用可能 • Log BucketのRetentionが30日以内であれば 課金されない Log Analytics https://cloud.google.com/blog/products/data-analytics/moving-to-log-analytics-for-bigquery-export-users
  5. • Cloud Loggingのログをそのまま参照できる Viewを指定Dataset配下に作成する機能 • メリット ◦ Log Bucketに入ってくるログをリアルタイムで 参照できる

    ◦ BigQueryには実データを保持しない ◦ Viewではtimestampフィールドでpartitioning されているためスキャン量を制限可能 Log AnalyticsのLinked Dataset https://cloud.google.com/blog/products/data-analytics/moving-to-log-analytics-for-bigquery-export-users
  6. 新しい構成 Log Router Cloud Logging Log Bucket Cloud Logging Linked

    Dataset BigQuery Speed Layer BigQuery TVerTag 収集 集約 Batch Layer ETL Batch Layer BigQuery 集計用View BigQuery ※開発中
  7. 結論 • TVerのサービス戦略に合わせて統一的に拡張性高くログを収集・集約できるログ 基盤をGoogle Cloudのサービスや機能を活用して構築した ◦ ①突合の手間がかかる ▪ →複数のログ種別を一つのログ基盤で統一的に収集・集約が可能 ◦

    ②ログ種別を後から追加可能 ▪ →ログおよびシステムの拡張性を実現 ◦ ③Google Cloudのサービスでコストを抑えたデータ基盤を開発 ▪ →コストを最小限に抑えた構成で実現