Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Yappli Data Hubの謎に迫る踊る24新卒 / Closing in on the ...

Yappli Data Hubの謎に迫る踊る24新卒 / Closing in on the secret behind Yappli Data Hub by New Grads in 2024

Yappli Tech Conference 2024 登壇資料

connpass:
https://yappli.connpass.com/event/328754/

セッション動画(YouTube):
https://youtu.be/cnr7In9Ztz4?si=5wht7pwf_cm0ahJN

Yappli Developers

December 04, 2024
Tweet

More Decks by Yappli Developers

Other Decks in Technology

Transcript

  1. Speaker 開発統括本部 プロダクト開発本部 開発2部 サーバー3グループ ⼤﨑 敬太 • 24卒 ◦

    2023年から内定者インターンでジョイン! • 好きなデータは⽣体情報関連(ECG)
  2. 取得しているデータ 01 Yappli Data Hubについて ①⾏動データ ②イベントデータ ③属性データ 各機能の閲覧ログ ボタンアクションログ

    ユーザ情報 • ホームの閲覧 • クーポンページ閲覧 • スタンプページ閲覧 • クーポンの使⽤状況 • プッシュ通知の開封 • プッシュ通知の詳細 • 性別 • 年齢 • エリア
  3. 最近の進化 GCP サービスのバージョン対応 • GCP Dataflow SDKバージョンのアップグレード • Cloud Functions

    のランタイムをアップデート(第2世代) 社内管理コスト削減 • Yappli Data Hubクライアントを管理しやすいように改善 03 直近の取り組みについて
  4. 最近の進化 GCP サービスのバージョン対応 • GCP Dataflow SDKバージョンのアップグレード • Cloud Functions

    のランタイムをアップデート(第2世代) 社内管理コスト削減 • Yappli Data Hubクライアントを管理しやすいように改善 03 直近の取り組みについて
  5. • Dataflow SDKバージョンアップ対応 ◦ Dataflow で利⽤している Apache Beam SDK for

    Java を 2.34.0 から 2.56.0 ▪ ⾮推奨バージョンからサポート対象バージョンまでアップグレード GCPサービスのバージョン対応 03 直近の取り組みについて
  6. • Dataflow SDKバージョンのアップグレード ◦ ⾟みポイント ▪ Javaアプリケーションの知⾒がチーム内にないため修正コストが⾼い ▪ バージョンアップに伴うリリース変更内容を追うことが⼤変 •

    AvroCoder クラスが廃⽌など ◦ 学び ▪ 定期的なアップデート • 差分が多くならないうちに定期的な確認とアップデートを! • バージョンアップ必要性の⾃動検知システムの構築! GCPサービスのバージョン対応 03 直近の取り組みについて
  7. • Cloud Functions のランタイムをアップデート(第2世代) ◦ Goのバージョンアップに伴い第2世代への移⾏が必要に • やったこと ◦ CloudEvent

    関数を利⽤したコードに書き換える ◦ Eventarc APIの有効化とロールの付与 ◦ CLIでデプロイしている場合)指定するオプションを変更 GCPサービスのバージョン対応 03 直近の取り組みについて
  8. • Cloud Functions 関数を第2世代への移⾏ ◦ 学び ▪ ドキュメントを⾒ることでGCPサービス周りの知識がインプットされた! • 担当者コメント

    GCPサービスのバージョン対応 03 直近の取り組みについて 個⼈でこんなにクラウドサービス触れる機会はそうそうないので AWSもGCPも触れるのでプロジェクト楽しいです!
  9. 最近の進化 GCP サービスのバージョン対応 • GCP Dataflow SDKバージョンのアップグレード • Cloud Functions

    のランタイムをアップデート(第2世代) 社内管理コスト削減 • Yappli Data Hubクライアントを管理しやすいように改善 03 直近の取り組みについて
  10. • クライアント追加時の流れ 1. jsonファイルにクライアント情報を追記 2. S3バケットの⽤意 3. ECS上の環境変数にも追加 • つらみポイント

    ◦ json の整合性検証 ◦ 管理情報が分散している 社内管理コスト削減 03 直近の取り組みについて { "clients": [ { "name": "大崎", "usecase": "外部ツールへの連携 " }, { "name": "New client", "usecase": "外部ツールへの連携 " } ] }
  11. 社内管理コスト削減 03 直近の取り組みについて S3へのデータ格納 Cloud Run Amazon S3 BigQuery Dataflow

    Cloud Storage Pub/Sub • 集計対象のクライアントをjsonファイルから読み取ってデータをS3へ ◦ GCSからBigQueryの間にも処理がありますが割愛させていただきます json *間の処理は割愛
  12. • DBでクライアントを管理 ◦ 管理情報を⼀元化! ◦ DBを参照することでECSタスクを⼀つに! 社内管理コスト削減 03 直近の取り組みについて データ提供

    外部ツール Amazon S3 Amazon S3 ECS Cloud Run Amazon S3 BigQuery Dataflow Cloud Storage Pub/Sub Amazon Aurora *間の処理は割愛
  13. • ⼯夫 ポイント ◦ クライアント情報をDB移⾏ ▪ データの⼀元管理! ▪ ECSタスクを⼀つに! 社内管理コスト削減

    03 直近の取り組みについて 異なるクラウドサービスのリソースへの アクセス周りの設計思想は難しさもありつつ⾯⽩い!
  14. Yappli Data Hubとは! • Yappli Data Hubはデータドリブンなアプリ運⽤を⽀援するサービス! ⽇々改善! • 改善ポイントはまだまだある!

    ◦ システム構成の再構築 ◦ S3バケットの⾃動⽣成 ◦ データ処理の改善 まとめ 04 まとめ