Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AWS Summit Tokyo 2015 freee

AWS Summit Tokyo 2015 freee

AWS Summit Tokyo 2015 にて、急成長しつづける freee、AWS との付き合い方という題目で発表いたしました。

freeeの急成長と、そのインフラを支えているAWSのり用の仕方についてインフラ担当者の松崎が発表しました。

セッション詳細は以下のリンクとなります。
http://www.awssummit.tokyo/session.html#TC-03

Keiji Matsuzaki

June 02, 2015
Tweet

More Decks by Keiji Matsuzaki

Other Decks in Technology

Transcript

  1. freeeの成長とAWS アジェンダ • 創業期 • 1stリリース • 第1次成長期 • 第2次成長期

    • 現在 2012年10月〜 2013年3月〜 2013年10月〜 2014年5月〜 2015年〜
  2. 創業期 2012年10月〜 2012年10月〜サービス開発時 さくらVPS 銀行 銀行 銀行 ※銀行データ同期 お客様 •

    2012年サービス開発時の構成はHerokuさん中心だった • DBすら、Herokuさんで構成していた • 銀行データ同期サービスはさくらVPSさん上で動かしていた • 各サービス間でのアクセス制御はできていない状態だった
  3. 創業期 2012年10月〜 2012年12月〜 初期構成から2ヶ月後 銀行 銀行 銀行 ※銀行データ同期 over SSL

    over SSL お客様 AWS 化 • 銀行データ同期サービスをAWS EC2上に移行しました • Herokuさんで稼働していたDBをRDS上に移行(ただしEC2) • Heroku <-> EC2 <-> RDS 間でのアクセス制御が可能になった • Heroku <-> AWS(Tokyoリージョン)間のレイテンシが気になるように
  4. 創業期 2012年10月〜 2013年1月〜 AWSを中心に構成し直す 銀行 銀行 銀行 ※銀行データ同期 Web App

    over SSL ※同期処理を非同期 化 deploy deploy お客様 AWS 化 • AWSを中心としたサーバ構成に乗り換えを終えた • jenkinsを利用したデプロイフローの自動化を行った • Amazon SQS を利用し、非同期的にデータ同期処理を行えるように • ログ集約をしなければいけないという新たな課題が上がった
  5. 1stリリース 2013年3月〜 2013年3月〜 サービス正式リリース 銀行 Web App Redis Job Worker

    NAT 銀行同期 developer お客様 踏み台 データ暗号化 VPC
  6. 1stリリース 2013年3月〜 2013年3月〜 サービス正式リリース 銀行 Web App Redis Job Worker

    NAT 銀行同期 developer お客様 踏み台 データ暗号化 VPC • CloudPackさんのお陰でVPC内にサービスを移行することができた • サービスリリース2週間前にVPC移行を決めたが成功した • VPC内でサービス構築行うことでセキュリティ面の不安点を払拭 • 銀行同期サービスとWebApplicationを分離することで侵入リスク考慮
  7. 第1次成長期 2013年10月〜 2013年10月 インフラエンジニア加入 銀行 Web App Redis Job Worker

    NAT 銀行同期 developer お客様 踏み台 データ暗号化 VPN • VPN接続が可能になった!
  8. 第1次成長期 2013年10月〜 2013年10月 インフラエンジニア加入 銀行 Web App Redis Job Worker

    NAT 銀行同期 developer お客様 踏み台 データ暗号化 VPN • Nagios -> Zabbix への変更によりサーバメトリクスの蓄積が可能に
  9. 第1次成長期 2013年10月〜 2013年10月 インフラエンジニア加入 銀行 Web App Job Worker NAT

    銀行同期 developer お客様 踏み台 データ暗号化 VPN ElastiCache
  10. 第1次成長期 2013年10月〜 2013年10月 インフラエンジニア加入 銀行 Web App Job Worker NAT

    銀行同期 developer お客様 踏み台 データ暗号化 VPN • EC2上で運用していたRedisインスタンスをElastiCacheに移行 • JobWorkerのスケールアウトがElastiCache移行により可能に
  11. 第1次成長期 2013年10月〜 2013年10月 インフラエンジニア加入 銀行 Web App Job Worker NAT

    銀行同期 developer お客様 踏み台 データ暗号化 VPN • ログデータ解析のための基盤としてElasticSearchとKibanaを導入 • エンジニアによるアプリケーションログの確認が容易に
  12. 第1次成長期 2013年10月〜 2014年2月 モバイルアプリリリース 銀行 Web App Job Worker NAT

    銀行同期 developer 踏み台 データ暗号化 VPN api iOS お客様 出先から
  13. 第1次成長期 2013年10月〜 2014年2月 モバイルアプリリリース 銀行 Web App Job Worker NAT

    銀行同期 developer 踏み台 データ暗号化 VPN api iOS お客様 出先から • モバイルアプリ向けのapi用インスタンスを用意 • APIを経由し、iOSアプリ側から会計情報を更新/取得 • モバイルアプリリリースによりお客様が出先でののデータ閲覧が可能に
  14. 第1次成長期 2013年10月〜 2014年4月 Androidアプリリリース 銀行 Web App Job Worker NAT

    銀行同期 developer 踏み台 データ暗号化 VPN api お客様 出先から iOS Android
  15. 第1次成長期 2013年10月〜 2014年4月 Androidアプリリリース 銀行 Web App Job Worker NAT

    銀行同期 developer 踏み台 データ暗号化 VPN api お客様 出先から iOS Android • Androidアプリをリリースした際、iOSアプリのインフラ基盤を流用 • インフラ基盤を流用したことにより迅速なリリースが可能になった
  16. 第1次成長期 2013年10月〜 サービス運用上の失敗 Drop DB 事件 (初期のお話!) → 開発環境のDBを消すスクリプトが合った →

    chef cookbookを適用したら対象が productionになった → スクリプトがcronで定期実行 → Drop DBがproduction RDS で実行
  17. 第1次成長期 2013年10月〜 サービス運用上の失敗 Drop DB 事件 (初期のお話!) → 即座にサービスをメンテナンス状態に →

    復旧のためRestore To Point In Timeにより削除前の時間を指定し復旧 → Restore To Point In Timeによる復元により、サービスの復帰
  18. 第1次成長期 2013年10月〜 サービス運用上の失敗からの対策 Drop DB 事件 (初期のお話!) → 結論 RDSは素晴らしい

    → 対策として、Drop DBができる権限のユーザは使わない → 現在はアプリごとに接続ユーザを分けたりしている (GRANTによる制限)
  19. 第1次成長期 2013年10月〜 サービス運用上の失敗からの対策 Drop DB 事件 (初期のお話!) → 結論 RDSは素晴らしい

    → 対策として、Drop DBができる権限のユーザは使わない → 現在はアプリごとに接続ユーザを分けたりしている (GRANTによる制限) • DROP, DELETEが行えるユーザを絞る、そのためのユーザを作成する • 初めてRestore To Point In Timeを使った復旧を実施 • 稼働中の運用・バックアップを含めたサービスであるRDSは素晴らしい
  20. 第2次成長期 2014年5月〜 2014年5月 クラウド給与freeeリリース 銀行 クラウド会計 freee Job Worker NAT

    銀行同期 developer 踏み台 データ暗号化 VPN api お客様 出先から iOS Android クラウド給与 freee
  21. 第2次成長期 2014年5月〜 2014年5月 クラウド給与freeeリリース 銀行 クラウド会計 freee Job Worker NAT

    銀行同期 developer 踏み台 データ暗号化 VPN api お客様 出先から iOS Android クラウド給与 freee • 2015年5月にクラウド給与ソフト freee リリース • クラウド会計ソフト freee と同一VPC内で別サービスとしてリリース
  22. 第2次成長期 2014年5月〜 2014年5月 共通認証基盤リリース 銀行 クラウド会計 freee Job Worker NAT

    銀行同期 developer データ暗号化 VPN api お客様 出先から iOS Android クラウド給与 freee 共通認証基盤
  23. 第2次成長期 2014年5月〜 2014年5月 共通認証基盤リリース 銀行 クラウド会計 freee Job Worker NAT

    銀行同期 developer データ暗号化 VPN api お客様 出先から iOS Android クラウド給与 freee 共通認証基盤 • 共通認証基盤サービスを内部サービスとして提供 • 2つのサービス間でのアカウント連携が可能に • 共通認証基盤用gemパッケージを利用し、通信のことを考えずに実装可能
  24. 第2次成長期 2014年5月〜 サービス運用上の失敗 Security Group 100いっちゃった事件 • 1つのVPC内でProduction, Stagingの運用をしていた •

    サービスが成長するが、VPC分割、設計見直しを考えていなかった • Security Groupのホワイトリスト形式での厳しい切り分けを行っていた • 100に達するまで、VPC内でのSecurity Group上限を意識していなかった
  25. 第2次成長期 2014年5月〜 サービス運用上の失敗を改善する Security Group 100いっちゃった事件 • ACL, VPC, ネットワークセグメントの再設計中

    • Security Groupを極力減らす運用ができないか設計中 • 次の確定申告時期までタイムリミットが決まってるので切実
  26. 解析基盤の改善 解析基盤の改善 (初期) Web App 銀行同期 Job Worker Map Reduce

    insight developer marketing... ダッシュボードを閲覧
  27. 作業のコード化 例えばこういう秘伝のタレ... seq -w 20 | xargs -P8 -n1 -INN

    ssh svr-NN "touch /var/stop.txt; while ps auxw | grep -Po \s+process\s+; do sleep 1; printf .; done; rm -fv /var/stop.txt"