Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
モノリスから小さなシステムへ / Chatworkシステム移行の現在地と今後について@開発生産...
Search
tan-yuki
June 29, 2024
Technology
3
5.1k
モノリスから小さなシステムへ / Chatworkシステム移行の現在地と今後について@開発生産性カンファレンス
2024/06/29(土)開発生産性Conference2024での登壇資料です
tan-yuki
June 29, 2024
Tweet
Share
More Decks by tan-yuki
See All by tan-yuki
2024-03-16 社員30人 → 300人のフェーズを経験し見えてきた、 エンジニアとして成長するための考え方
tanakayuki
5
1.5k
リリースから12年! Chatworkの過去をふりかえり ~ ChatworkとPHPの歩み ~
tanakayuki
0
690
フィーチャーチーム化への取り組みと、それを支える組織マネジメント体制
tanakayuki
2
23k
運用について - 2020 Chatwork サマーインターンシップ
tanakayuki
0
760
Chatworkから学ぶインフラサービス提供の心得.pdf
tanakayuki
0
1.5k
ChatWorkとPHPと私
tanakayuki
14
15k
開発者からみたCloudSearch
tanakayuki
2
2.6k
git
tanakayuki
3
540
Other Decks in Technology
See All in Technology
フロントエンド設計にモブ設計を導入してみた / 20241212_cloudsign_TechFrontMeetup
bengo4com
0
1.9k
終了の危機にあった15年続くWebサービスを全力で存続させる - phpcon2024
yositosi
10
7.9k
Fanstaの1年を大解剖! 一人SREはどこまでできるのか!?
syossan27
2
170
小学3年生夏休みの自由研究「夏休みに Copilot で遊んでみた」
taichinakamura
0
150
どちらを使う?GitHub or Azure DevOps Ver. 24H2
kkamegawa
0
770
サーバレスアプリ開発者向けアップデートをキャッチアップしてきた #AWSreInvent #regrowth_fuk
drumnistnakano
0
190
マイクロサービスにおける容易なトランザクション管理に向けて
scalar
0
120
組織に自動テストを書く文化を根付かせる戦略(2024冬版) / Building Automated Test Culture 2024 Winter Edition
twada
PRO
13
3.7k
Google Cloud で始める Cloud Run 〜AWSとの比較と実例デモで解説〜
risatube
PRO
0
100
KnowledgeBaseDocuments APIでベクトルインデックス管理を自動化する
iidaxs
1
260
Amazon SageMaker Unified Studio(Preview)、Lakehouse と Amazon S3 Tables
ishikawa_satoru
0
150
Microsoft Azure全冠になってみた ~アレを使い倒した者が試験を制す!?~/Obtained all Microsoft Azure certifications Those who use "that" to the full will win the exam! ?
yuj1osm
2
110
Featured
See All Featured
Writing Fast Ruby
sferik
628
61k
Side Projects
sachag
452
42k
Building an army of robots
kneath
302
44k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
28
900
Docker and Python
trallard
42
3.1k
Git: the NoSQL Database
bkeepers
PRO
427
64k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
26
1.5k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
Navigating Team Friction
lara
183
15k
GitHub's CSS Performance
jonrohan
1030
460k
VelocityConf: Rendering Performance Case Studies
addyosmani
326
24k
Transcript
田中 佑樹 2024年06月29日 開発生産性カンファレンス2024 モノリスから小さなシステムへ Chatworkシステム移行の現在地と今後について 1
自己紹介 名前 田中 佑樹(たなか ゆうき) 経歴 エンジニア ⇢ EM 誰?
Chatwork株式会社 執行役員 兼 CP本部 副本部長 お仕事 プロダクト人材に関わる採用や 組織開発など。 2
会社概要 1 3
会社概要 会社名 Chatwork株式会社 代表取締役CEO 山本 正喜 グループ従業員数 465名(2024年3月末日時点) 所在地 東京、大阪
設立 2004年11月11日 4
• 2024年7月1日より社名を株式会社kubell(読み:クベル)に変更 • 当社の事業はビジネスチャット単体から、ビジネスチャットを包含するBPaaS事業へと大きく拡大 • グループとして成長する企業群への展開を目指す意志をこめ、社名変更を実施 社名を「kubell」へ変更 すべての働く人の心に、薪を「くべる」存在へ。 そのような企業でありたいという想いと決意を、新しい社名に込めています。 株式会社kubell
kubell Co., Ltd. https://corp.chatwork.com/ja/kubell/ 特設サイトを公開中 5
事業概要 *1 Nielsen NetView 及びNielsen Mobile NetView Customized Report 2023年5月度調べ月次利用者(MAU:Monthly
Active User)調査。 調査対象はChatwork、Microsoft Teams、Slack、LINE WORKS、Skypeを含む44サービスをChatwork株式会社にて選定。 *2 2024年3月末時点 • 国内最大級のビジネスチャット「Chatwork」を展開。 業界のパイオニアであり国内利用者数No.1*1、導入社数は44.1万社*2を突破 • 圧倒的な顧客基盤とプラットフォームを背景に、DXされた業務プロセスそのものを提供する クラウドサービス、BPaaSを展開 BPaaS (Business Process as a Service) ビジネスチャット「Chatwork」 お客様 オペレーター 6
単位:% ビジネスチャットの市場環境 *1 当社依頼による第三者機関調べ、2023年12月調査、n=30,000 *2 内閣府「第5回 新型コロナウイルス感染症の影響下における生活意識・行動の変化に関する調査」より テレワーク率の変化 東京23区 全国
ビジネスチャット ツールを利用している 未だ低水準に止まる ビジネスチャット国内普及率*1 DX推進の流れを受け テレワークが急激に普及*2 普及率は19.0%ほどで、非常にポテンシャルが大きいマーケット 7
「Chatwork」の企業規模別 有料ユーザー割合 「Chatwork」のポジショニング プロダクトのターゲットを中小企業としているため、 主要な競合とは、中心となるターゲット層が異なっている 企業規模 大 企業規模 小 ITスキル
低 ITスキル 高 B社 中小企業を中心とした独自のポジショニング B社 A社 有料ユーザーのうち、ユーザー数ベースで 300人未満の契約が97.2%を占める*1 ※中小企業が大半であり、個社依存が少なく安定 *1 2024年3月末時点 8
長期ビジョン:ビジネス版スーパーアプリ ドキュメント 管理 Web会議 タスク管理 プロジェクト管理 ストレージ エンゲージメント SaaSで業務効率化 CRM/SFA
BPaaSで業務提供 人事評価 採用 電話代行 勤怠管理 労務管理 経営支援 資金調達 助成金 請求管理 契約管理 決済 会計 受発注管理 Chatworkはビジネス版スーパーアプリへ スーパーアプリ = プラットフォーム化し、あらゆるビジネスの起点になるアプリ • ビジネスチャットは、他SaaSと比較して圧倒的に滞在時間が長く、プラットフォームとしての価値が高い • Chatworkはオープンプラットフォームとして、様々なサービスやユーザー同士の連携が容易 BPaaSで業務提供 コアビジネスに注力できる環境 9
本日のお話 2 10
モノリスシステムのシステム移行の現在地点と今後の予定について 本日お話する内容 現在の「Chatwork」のシステムの状況 システム移行の現在地点と今後の予定について 11
「Chatwork」のシステム側面でみた現在の状況 3 12
「Chatwork」は2011年3月にリリースされ、10年以上が経過 現状は、一つの巨大なモノリスのシステム上で、ほぼすべての機能が実装されている リリースから10年超の巨大サービス 開発速度が低下しやすい状況 • 10年以上運用しているサービスのため、技術的負債がたまっている状況 • 同一のシステムを触るため、人数が増えれば増えるほどコミュニケーションが複雑になる • 巨大ゆえに認知負荷が非常に高くなりやすく、事故に繋がりやすい/変更・追加が困難
課 題 システムの現状 13
• ビジネスチャットは、業種や職種問わず、全従業員が業務時間中を通して使い続け るという特性を持つ • そのため、トラフィック量が膨大になる傾向 • 24時間365日止めることのできない、ビジネスにおける”インフラ”となるサービス =パフォーマンスとシステムとしての信頼性、どちらも高いレベルで担保する必要がある 高い非機能要件 利用ユーザーの多さ
導入社数 ※ 2024年3月末時点 44.1万 登録ID数 685.3万 DAU 112.4万 現状のトラフィック量 www.chatwork.comのCloudFrontのメトリクス。 リクエスト量が現時点(※)で毎分106万ほど。 秒間約1.7万以上のリクエストをさばいている。 ※ 2024年2月時点 システムの特徴 14
データストレージ / キャッシュ 実行基盤 検索サーバー メッセージングシステム モバイルアプリ Web UI API
エンドポイント システム構成イメージ S3 Aurora DynamoDb ElastiCache 15
リプレイス作業の現在地点 目的 • 今後の事業成長のブレーキとならないためのシステム性能限界の解消 • 今後の事業成長をより加速させるための開発生産性の向上 現在地点 • DBへの負荷が高いシステムのリプレイスを実施中 今後の課題
• このリプレイスを完了できたとしても、一部分のリプレイスにとどまってしまい巨大なアーキテク チャ全体に対してどのように戦っていくのかの戦略検討を深めていきたい • 今後の全体のアーキテクチャをどのように進化させていくか、のVisionを示す必要がある 16
アーキテクチャ刷新と開発生産性 4 17
開発生産性? 生産性とは? • アウトプット ÷ インプット • どの程度のインプットで、どの程度のアウトプットが出せたか? ソフトウェア開発における開発生産性とは? •
アウトプット ◦ ソースコード、プルリクエスト量、開発した機能数、ユーザー満足度、売上、etc… • インプット ◦ 労働時間、労働人員、etc… 参考)開発生産性について議論する前に知っておきたいこと 18
開発生産性? 開発 アウトプット アウトカム 19
開発生産性? ソースコード プルリクエスト量 機能数 ... ユーザー満足度 売上・総利益 ... 開発 アウトプット
アウトカム 20
開発生産性? 生産性? 開発 アウトプット アウトカム 21
開発生産性? 広義の 開発生産性 狭義の 開発生産性 開発 アウトプット アウトカム 22
開発生産性? ディスカバリー含めた プロダクト改善プロセス全体が対象 ソフトウェア開発プロセス のみが対象 広義の 開発生産性 開発 アウトプット アウトカム
狭義の 開発生産性 23
ソフトウェア開発ライフサイクルの指標 Lead Time, Cycle Time & Change Lead Time •
Lead Time: バックログに積まれてから(事業責任者が意思決定してから)デプロイまでにかかる時間 • Cycle Time: 開発開始してからデプロイまでにかかる時間 • Change Lead Time: コードが 最初にcommit されてからデプロイまでにかかる時間 First Commit 24
アーキテクチャ刷新は開発生産性へどう影響を与えるのか? • 「狭義の開発生産性」への影響 … 保守性の向上・変更や拡張のしやすさ ◦ 狭義の開発生産性:Cycle Time / Change
Lead Time • 「広義の開発生産性」への影響 … 組織構造の最適化 ◦ 広義の開発生産性:Lead Time アーキテクチャ刷新と開発生産性との関係性 25
「Chatwork」リプレイス戦略のふりかえり 5 26
「Chatwork」のリプレイスの歴史のふりかえり • 「Chatwork」は過去にメッセージ機能のリプレイスを実施 ◦ 大規模なリプレイスを計画し、年単位のPJを実施したが途中で挫折 ◦ その後、メッセージ機能にのみ焦点を当てリプレイス作業を実施 参考)Chatworkの新メッセージングシステムを支える技術 • その後もいくつかのサブシステムを実装・リリース
• 現状は他の領域へのリプレイスも計画・実行に移している状態 ◦ しかし、10年以上の歴史が積み重なったアプリケーションを すべてリプレイスするのは非常に難易度が高い ◦ 現在は特に負荷の高い部分に範囲を絞りリプレイスを実施中 27
現在のシステムアーキテクチャ etc 28
現在のシステムアーキテクチャ etc PHP Scala 29
リプレイス戦略に関してのふりかえり • 現在は特に負荷の高い部分に範囲を絞りリプレイスを実施中(再掲) ◦ 今後のアーキテクチャ刷新の計画については不透明な観点が多かった • 今後のアーキテクチャの進化の戦略をより明確にしていき、組織の構造もそれに合わせて アップデートしていきたい タスクフォースチームを結成し、 今後のアーキテクチャ進化の道筋を描くことに
30
アーキテクチャの進化を描くタスクフォースチーム 6 31
タスクフォースチームの目的 ゴール • 将来必要になるであろうアーキテクチャと組織体制を定義する • そこへ向かう道筋を示し、組織全体が「今何をするべきなのか?」が理解されている状態を目指す why? • 今後のビジネスをドライブさせるため ◦
開発生産性を維持・向上できるようなプロダクトと組織を目指したい 32
タスクフォースチーム結成! who? • 人員の選定 -> 「Chatwork」全体の既存の仕組みや仕様について詳しい人を招集したい • 各チームのリードエンジニアをバランスよく招集 ◦ リプレイス作業に関して知見が深いメンバー
◦ 既存のアプリケーション仕様に詳しいメンバー • 最終的に揃ったメンバー:4人の精鋭たち + ぼく 33
タスクフォースチームの具体的なタスク ゴール(再掲) • 将来必要になるであろうアーキテクチャと組織体制を定義する • そこへ向かう道筋を示し、組織全体が「今何をするべきなのか?」が理解されている状態を目指す 想定インクリメント • AsIs(現状)の分析 ◦
現状把握 / 課題認識、イシューの特定 / ドメイン分析 / 開発プロセス • Visionの策定 ◦ 理想的な組織体制 / 組織体系に沿ったアーキテクチャ • 戦略の策定 ◦ Visionに向かうまでの時間軸を伴う方針 ◦ 具現化する上で必要なCapability、採用計画 34
タスクフォースチームの成果 • 当初、3週間(3 Sprint)と最初に期間を決めゴールを目指す ◦ 毎週スプリントを実施し、ステークホルダー(= チームの代表者、PdM)からのレビューを実施 • なんとか期間内で目標自体は達成 🎉
◦ 自分はファシリテーターとして振る舞い、今後やることついての取りまとめ、レビュー会のファ シリテーションなどを担当 • 方向性についてはある程度見えてきた スプリントレビュー用資料 スプリントレビューに対してのコメント 35
現状分析の詳細 7 36
「Chatwork」は2011年3月にリリースされ、10年以上が経過 現状は、一つの巨大なモノリスのシステム上で、ほぼすべての機能が実装されている リリースから10年超の巨大サービス 開発速度が低下しやすい状況 • 10年以上運用しているサービスのため、技術的負債がたまっている状況 • 同一のシステムを触るため、人数が増えれば増えるほどコミュニケーションが複雑になる • 巨大ゆえに認知負荷が非常に高くなりやすく、事故に繋がりやすい/変更・追加が困難
課 題 現状のシステムの状況(再掲) 37
「Chatwork」は2011年3月にリリースされ、10年以上が経過 現状は、一つの巨大なモノリスのシステム上で、ほぼすべての機能が実装されている リリースから10年超の巨大サービス 開発速度が低下しやすい状況 • 10年以上運用しているサービスのため、技術的負債がたまっている状況 • 同一のシステムを触るため、人数が増えれば増えるほどコミュニケーションが複雑になる • 巨大ゆえに認知負荷が非常に高くなりやすく、事故に繋がりやすい/変更・追加が困難
課 題 現状のシステムの状況(再掲) 課題の主な原因? 38
モノリスの種類 • 「Chatwork」のシステムに当てはまっているモノリス ◦ アプリケーションモノリス ◦ データベース結合モノリス ◦ モノリシックビルド /
モノリシックリリース (出典)マシュー・スケルトン,マニュエル・パイス.『チームトポロジー 価値あるソフ トウェアをすばやく届ける適応型組織設計』.日本能率協会マネジメントセンター.2021年 ソフトウェア開発組織について語るためには 避けては通れない神本 39
アプリケーションモノリス • アプリケーションモノリス ◦ アプリケーションモノリスは多くの依存関係や責任を持つ単一かつ巨大なアプリケーションで、 多くのサービスやさまざまなユーザージャーニーを外部に公開しているものである。* • 現状のドメイン分析をした結果が下記(かなり抽象的に書いている) ◦ 下記を現状はほぼ全て一つのアプリケーションで実現している
*(出典)マシュー・スケルトン,マニュエル・パイス.『チームトポロジー 価値あるソフトウェアをすばやく届ける適応型組織設計』.日本能率協会マネジメントセンター.2021年.p138 40
ドメインに対するチームの状況 • 先に書いたドメイン図に対し、担当するチームをプロットしてみた結果↓ • 担当領域が重複している箇所や、責任範囲が広すぎるチームなど、問題が可視化できた • 具体的な症状:責任範囲の曖昧さによるお見合い、責任範囲が広すぎることによる認知負荷の増大 • なぜこのような状態なのか?:システムが分割できていないことにより責任範囲が曖昧 41
• データベース結合モノリス ◦ データベース結合モノリスは、同一のデータベーススキーマと結合している複数のアプリケー ションやサービスから構成されており、それぞれ別々に変更、テスト、デプロイするのが難し い。これは、組織がサービスではなくデータベースをコアのビジネスのエンジンだと考えている 場合に発生することが多い。* • 現在の状態 ◦
複数のシステムがありながらそれぞれのアプリケーションが共通のデータベースに依存し、 強い整合性を前提として設計されている ◦ データモデルの変更難易度が高く、データベース分割などの改善を行うのも難しい データベース結合モノリス *(出典)マシュー・スケルトン,マニュエル・パイス.『チームトポロジー 価値あるソフトウェアをすばやく届ける適応型組織設計』.日本能率協会マネジメントセンター.2021年.p138 42
モノリシックビルド / モノリシックリリース • モノリシックビルド ◦ モノリシックビルドでは、コンポーネントの新バージョンのために、単一の巨大な継続的インテ グレーション(CI)でビルドを行う。アプリケーションモノリスがモノリシックビルドをもたら すが、小規模なサービスでも同じ問題は起こりうる。* •
モノリシックリリース ◦ モノリシックリリースは、小さなコンポーネントをまとめて「リリース」する。コンポーネント やサービスはCIで独立してビルド可能でも、サービスのモックは使わず共有の固定環境でしかテ ストできない場合、全コンポーネントの最新バージョンをまとめて同一の環境に導入することに なる。コンポーネント一式をひとかたまりとしてデプロイすることで、テストしたものが本番環 境でも実行されるという確証を得るのだ。** *(出典)マシュー・スケルトン,マニュエル・パイス.『チームトポロジー 価値あるソフトウェアをすばやく届ける適応型組織設計』.日本能率協会マネジメントセンター.2021年.p139 **(出典)マシュー・スケルトン,マニュエル・パイス.『チームトポロジー 価値あるソフトウェアをすばやく届ける適応型組織設計』.日本能率協会マネジメントセンター.2021年.p139 43
本質的な課題はなにか? 先のモノリスの中で、一番の本質的な課題はデータベース結合モノリスではないか?という仮説 • いままではアプリケーションモノリスを解消しようとしていたが、結局のところこのデータベース結 合モノリスを解消しない限り、本来の課題解決には繋がらないのでは? why? • アプリケーションを分割したところで、データが複数のアプリケーションで共有されているとデータ モデルが変更しづらく、アプリケーションの独自進化できないため •
いわゆる ”分散モノリス” の状態からは脱せられない 44
アーキテクチャ移行に向けた戦略 8 45
アーキテクチャ刷新によって成し遂げたいVisionは? 成し遂げたい状態定義 = 生産性の向上をどう獲得していくか? • ビジネスドメインを適切な節理面で分割していく ◦ → それぞれのビジネスドメインごとにチームを紐づける ◦
→ ビジネスドメインとチームを整理することで、施策の実現になにが必要なのか高速に判断、 実装できる状態にする 46
今後の移行戦略について 前提(捉え方) • 我々のアプリケーションは歴史が積み重なっており、アーキテクチャ移行は難易度が非常に高い • そのため、一足飛びに完全移行を目指すのではなく、漸進的に進める方法を模索したい → 少しずつ価値を作りながら進めていきたい 47
今後の移行戦略について • 大きく2つのパターンを検討 ◦ デプロイメントを分割し、その後アプリケーションコードとデータベースを分割していく方法 ◦ データベースをまず分割し、分割されたデータベースを利用してサブシステムを実装する方法 それぞれ詳細を見ていく 48
デプロイメント分割から始めるパターン 49
デプロイメントの分割から始めるパターン • ビジネスドメインの節理面を分析し、その境界でシステムを切り分け、チームを分割していく ◦ 分け方として、例えばAPIエンドポイントごとの単位で分けていく ◦ ALBなどでルーティングして、各チームのシステムへリクエストを流す 50
デプロイメント分割のメリット / デメリット • メリット ◦ 節理面さえわかればソースをコピーし自チームで管理することでチーム分割は早い段階で可能 • デメリット ◦
一度デプロイメントを分割してしまうともとに戻すことは非常に大変 ◦ 複数アプリケーションから一つのDBへの依存をすることでDBモノリスの側面を強めてしまう DBモノリスの負の側面を強めてしまう デプロイメントを分けた後は基本的には元 には戻れない 51
デプロイメント分割の進め方 • まずは節理面に従ってデプロイメントを分割するが、先程記載した通りDB結合モノリスの負の側面を 強めることになるので早めに自チームでの管理するべきデータを特定していく • 特定できたら既存のデータからのデータ移行を計画、アプリケーション分割からできるだけ早いタイ ミングで自チームで管理するデータストレージを作りにいくのが望ましい 52
データベース分割から始めるパターン 53
データベース分割から始めるパターン アプリケーション分割の前にDBから分割するパターン • 担当ビジネスドメインを分析し、自分たちが所有するデータを明確にする • 担当ビジネスドメインの専用データベースを構築する • 最終的には専用データベースに対してサブシステムを構築する 54
データベース分割から始めるメリット / デメリット • メリット ◦ DB結合モノリスの問題に早い段階でアプローチできる ◦ 先にアプリケーション分割をしてしまうとDBのリファクタリングは行いづらくなる •
デメリット ◦ デプロイメント分割に比べ、各チームに独立したサービスを割り当てられるまでに時間がかかる 55
今後のモノリス解消への体制 56
いままでのリプレイスプロジェクトの進め方の課題 いままでのシステム分割のやりかた • システム分割専任のチームを用意し、システム分割をプロジェクト的に進めていた 課題 • 難易度が高く、開発人員が多く必要 → 巨大プロジェクトになりやすい •
「負債返済チーム」と「機能開発・運用保守チーム」に分かれてしまう ◦ 組織の分断 ◦ 両方のチームにドメイン知識が必要なため、パワーが2倍必要 57
システム分割をどのような体制ですすめていくか? 今後の進め方 • システム分割専任のチームを作らずに、全チームが機能改善、保守運用と並行しながらシステム分割 を遂行できるような状況をめざしたい why? • 巨大なプロジェクトにするのではなく、少しずつ機能開発と並行しながら進められる • 同一のドメイン知識を有したチームでモノリスの解消を進められる
• 状況に応じて新規開発に注力できる → ビジネスの変化に応じやすくなる 58
まとめ 9 59
以上、タスクフォースチームでやったことの紹介でした • Chatworkでの今後のモノリスの解消の方法を紹介しました • これからは、先に述べた2つのパターンを使い分けながらモノリスを解消していく ◦ デプロイメント分割から始めるパターン ◦ データベース分割から始めるパターン •
分割していくシステムの特徴と、それぞれの分割パターンのメリット・デメリットを照らし合わせた うえで移行パターンを決定していく 一筋縄ではいきませんが、モノリスを解消し開発生産性を飛躍的に上昇させ、チームと会社が幸せになる 未来を目指していきます 60
• 戦略とは? ◦ AsIs -> ToBeの定義、詳しくは下記弊社COOのブログを参照ください ◦ 参考)戦略とは何か? / note
Appendix:戦略とは? \ ブログのURLはこちら! / 61
Join Our Team! Chatwork採用 https://recruit.chatwork.com/engineer/ 働くをもっと楽しく、創造的に 62