Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
メールサービスの信頼性を支えるSREの取り組み
Search
haruki
July 05, 2024
Technology
2
2.2k
メールサービスの信頼性を支えるSREの取り組み
haruki
July 05, 2024
Tweet
Share
More Decks by haruki
See All by haruki
「SRE初心者からの挑戦! 半年でやってきたことと今後の展望」
harukin721
0
1.5k
Other Decks in Technology
See All in Technology
生成AIをテストプロセスに活用し"よう"としている話 #jasstnano
makky_tyuyan
0
210
AIエージェントの継続的改善のためオブザーバビリティ
pharma_x_tech
6
1.3k
菸酒生在 LINE Taiwan 的後端雙刀流
line_developers_tw
PRO
0
230
AI技術トレンド勉強会 #1MCPの基礎と実務での応用
nisei_k
1
220
宇宙パトロール ルル子から考える LT設計のコツ
masakiokuda
2
110
活きてなかったデータを活かしてみた話 / Shirokane Kougyou vol 19
sansan_randd
1
360
Amazon Q Developer for GitHubとAmplify Hosting でサクッとデジタル名刺を作ってみた
kmiya84377
0
3.5k
DroidKnights 2025 - Jetpack XR 살펴보기: XR 개발은 어떻게 이루어지는가?
heesung6701
1
130
Kotlinで学ぶ 代数的データ型
ysknsid25
5
1.1k
CIでのgolangci-lintの実行を約90%削減した話
kazukihayase
0
310
Javalinの紹介
notoh
0
110
kotlin-lsp を Emacs で使えるようにしてみた / use kotlin-lsp in Emacs
nabeo
0
160
Featured
See All Featured
Building Applications with DynamoDB
mza
95
6.4k
Building a Scalable Design System with Sketch
lauravandoore
462
33k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
30
2.1k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.2k
Stop Working from a Prison Cell
hatefulcrawdad
269
20k
Fireside Chat
paigeccino
37
3.5k
Practical Orchestrator
shlominoach
188
11k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
123
52k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3k
We Have a Design System, Now What?
morganepeng
52
7.6k
Transcript
1 メールサービスの信頼性を支えるSREの取り組み 上島 春輝 / GMO Pepabo Inc. 2024.07.05 Road
to SRE NEXT@京都
2 1. 自己紹介
GMOペパボ 技術部 プラットフォームグループ 2022年9月 中途入社 3 自己紹介 上島 春輝 Uejima Haruki •
カラーミーショップのSRE • メール勉強中!!! • 初の社外登壇 • 奈良県出身 X : @harukin721
4 2. 担当サービス紹介
カラーミーショップ 5 担当サービス紹介 国内最大級のECサイト作成サービス ◦ 2005年にサービス開始 ◦ 現在のショップ数:約4万店舗 ◦ 現在の流通総額:約2,000億円
メールサービスの規模 ◦ メールアカウント数:約85,000ユーザー ◦ メールサーバー:20台 ◦ メールリレーサーバー:8台
6 3. メールサービスの信頼性とは
メールサービスの信頼性 7 メールサービスの信頼性とは • メールのなりすましや改ざんがなく、メールが遅延なく到達する • メールアカウント数やメールの送受信量の増加に柔軟に対応できる • CS部門と連携して、お問い合わせにすばやく対応できる
8 4. 発生した問題
9 ショップオーナーさん: 「メールが届いていないようです。」
なぜ、メールが届いていない? 10 発生した問題 • メールが届かない原因は多岐にわたる ◦ 特定の宛先のみメールが届いていないのか? ◦ 特定のメールサーバーからのみメールが届いていないのか? ◦
IPレピュテーションが低下して、DNSBLに登録されているのか?
11 特定のメールサーバから、 特定のサービスプロバイダ宛てのみ、 メール送信がブロックされていた
12 4. 対応と対策
13 自分たちでコントロール できることで対応を行う
どう対応したのか? 14 対応と対策 • Postfixのtransportファイルを使用し、特定のサービスプロバイダ宛 てのメール送信は別のメールサーバーを経由する • 送信元メールサーバーのIPを変更することで、ブロックを回避する • サービスプロバイダにブロックの解除申請を出す
Postfixのtransportファイル 15 対応と対策 • メールの送信経路を特定のサーバー経由に設定できる • ドメインやアドレスごとに送信経路を個別に設定できる
16 お問い合わせの前に気づくためには
お問い合わせの前に気づくためには 17 対応と対策 • 監視スクリプトを開発し、ブロックを自動的に検知 ◦ メールログから情報を取得し、問題を検知後はSlackへオンコール通知 ◦ オンコールドキュメントを作成し、アクションを起こして対応 SRE本
アラート : 「人間が即座にアクションを起こし て対応し、状況を改善しなければ ならないことが生じている、あるい は生じようとしていることを知らせ ます。」
18 メール送信量の増加を検知
メール送信量の増加を検知 19 対応と対策 • メール送信量の急激な増加はブロックを引き起こす可能性がある ◦ Gmailのガイドラインにも明記されている ◦ メール送信量の急激な増加を検知することは重要 ◦
メールアカウントが乗っ取られ、知らぬうちにスパム配信の温床になっ ていた場合など、問題発生時の初動対応が早くなる
20 5. まとめ
まとめ 21 まとめ • メールは、意図せずブロックされてしまうことがある • SREノウハウをメールサービスにも取り入れて改善 ◦ お問い合わせ前にブロックを検知 ◦
オンコールドキュメントを作成し、迅速に対応 ◦ メール送信量の急激な増加を検知
ご静聴ありがとうございました! 22