概要SLI/SLOはSREでよく使われる概念ですが、モバイルアプリ開発にはまだ馴染みが薄いかもしれません。
私たちのプロダクトでは障害発生率が高く、早期の検知と解消が求められていました。
そこで、SLI/SLOの概念をモバイルアプリに適用し、ユーザー体験の低下を即時に検知する仕組みを構築しました。この仕組みにより、以下の指標をリアルタイムで監視し、即時に対応可能となりました:
•失敗率:一定以上のユーザーが機能利用時にエラーが発生したケース
•キャンセル率:一定以上のユーザーが機能利用時に何らかの理由でキャンセルしたケース
•中断率:一定以上のユーザーが機能利用時にアプリを強制終了したケース
現在、この監視システムは40以上の機能に適用されています。このセッションでは以下の内容について詳しく解説します:
1.SLI/SLOの基本概念
2.一般的なSLI/SLOとユーザー体験を検知するSLI/SLOの違い
3.ユーザー行動の計測方法
4.計測基盤の構築:工夫と課題
•時系列データのログ計測
•高オブザーバビリティの実現オプション
5.アラート基盤の構築:工夫と課題
•ノイズ最小化の方法
•チームにアラートを定着させる方法
想定視聴者
•Flutterアプリ内でのDartを用いた計測基盤構築に興味がある方