Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AWS パートナー企業でテクニカルサポートに従事して2年経ったので思うところをまとめてみた

AWS パートナー企業でテクニカルサポートに従事して2年経ったので思うところをまとめてみた

2024年4月6日に開催された JAWS-UG北陸新幹線 ( 福井開催 )で登壇した際の資料です。
AWS に限らず、テクニカルサポートへの問い合わせをする際に留意した方が良い内容など、私が日々業務をしていて感じていることをお伝えしたいと思います。
AWS を使いこなしている方から、これから利用しようとお考えの方の参考になれば幸いです。

<4月15日追記>
17スライド目のサブタイトル部分や21、28スライド目で「SLA」と表記している箇所は、正確には「応答目標時間(SLO)」とすべき箇所でした。
なんらかの登壇機会があれば正式に資料側を訂正したいですが、AWS サポートとしては SLA「は」存在せず「SLO」なので訂正させていただきます。

kazzpapa3

April 06, 2024
Tweet

More Decks by kazzpapa3

Other Decks in Technology

Transcript

  1. 4 あらためまして 名前︓市野 和明(いちの かずあき) 所属︓株式会社サーバーワークス マネージドサクセス部 テクニカルサポート課 好きな AWS

    サービス︓ AWS CLI (テクサポとして) 嫌いな AWS サービス︓ Amazon FSx for Windows 趣味︓⾳楽鑑賞、酒を飲む @kazzpapa3
  2. 10 は︖ > 今朝から AWS につながりません。 > 障害など起きていないでしょうか。 ただ、多少誇張した妄想的な⽂⾯ではあるものの 100%

    妄想というわけでもない 本質的な部分では同質なお問い合わせをいただくことは、実は結構ある これは私が夢でみかけた⽂章 ある特定のお客様からいただいた⽂⾯そのままではない
  3. 12 あの⽂⾯で(私が、かろうじて)読み取れること • AWS マネジメントコンソール⾃体か、 AWS で作成した何らかのリソースに対して接続できない状態が発⽣している︖ • 「AWS に繋がらない」の部分から

    • すでに収束した事象に対して原因究明をしたい問い合わせではなく、 現在も継続中の事象に対しての問い合わせではないか︖ • 今朝から AWS に繋がらない ← 繋がらない時間帯があった。という書き⽅ではない点から推測
  4. 13 あの⽂⾯で(私が、かろうじて)読み取れること • AWS マネジメントコンソール⾃体か、 AWS で作成した何らかのリソースに対して接続できない状態が発⽣している︖ • 「AWS に繋がらない」の部分から

    • すでに収束した事象に対して原因究明をしたい問い合わせではなく、 現在も継続中の事象に対しての問い合わせではないか︖ • 今朝から AWS に繋がらない ← 繋がらない時間帯があった。という書き⽅ではない点から推測 • ⽇本国内のお客様なので、「今朝」と記載されているのは、 私が思う今朝と同じ頃︖ • 7時 〜 9時すぎくらいまでの間あたりとか︖
  5. 14 あの⽂⾯で(私が、かろうじて)読み取れること • AWS マネジメントコンソール⾃体か、 AWS で作成した何らかのリソースに対して接続できない状態が発⽣している︖ • 「AWS に繋がらない」の部分から

    • すでに収束した事象に対して原因究明をしたい問い合わせではなく、 現在も継続中の事象に対しての問い合わせではないか︖ • 今朝から AWS に繋がらない ← 繋がらない時間帯があった。という書き⽅ではない点から推測 • ⽇本国内のお客様なので、「今朝」と記載されているのは、 私が思う今朝と同じ頃︖ • 7時 〜 9時すぎくらいまでの間あたりとか︖ ただしこれらは、あくまで私の推測に過ぎない 聞かなわからん
  6. 15 ツッコミどころは多いが… お客様に確認したいポイントは思いつく限り以下かと思われます。 • 接続できない対象は何︖ • AWS マネジメントコンソール︖AWS アカウント内に存在する何かのリソース︖ •

    接続できないのは「誰もが接続できない」のか「特定のユーザーだけ」なのか︖ • 発⽣時間帯は︖ 今朝というアバウトな時間軸ではなく、明確に何時ごろ、という情報がほしい。 • さらに⾔うなら、⽇本時間ですよね︖という確認はしておきたい。 • 現在も継続中なのか︖収束しているのか︖ • 時間軸の話で⾔うなら「今回初めて」なのか「⼀定程度発⽣していた」のか、発⽣頻度の情報もほしい。
  7. 16 ツッコミどころは多いが… お客様に確認したいポイントは思いつく限り以下かと思われます。 • 接続できない対象は何︖ • AWS マネジメントコンソール︖AWS アカウント内に存在する何かのリソース︖ •

    接続できないのは「誰もが接続できない」のか「特定のユーザーだけ」なのか︖ • 発⽣時間帯は︖ 今朝というアバウトな時間軸ではなく、明確に何時ごろ、という情報がほしい。 • さらに⾔うなら、⽇本時間ですよね︖という確認はしておきたい。 • 現在も継続中なのか︖収束しているのか︖ • 時間軸の話で⾔うなら「今回初めて」なのか「⼀定程度発⽣していた」のか、発⽣頻度の情報もほしい。 確認したいポイントはいくつもある
  8. 40 それぞれがどの情報にアクセスできるか、知りうるか 対象 AWS 利⽤者 (お客様) (私の所属企業のような) パートナー企業 AWS テクニカルサポート

    設計背景や実装 ◦ 知っている × 知り得ない × 知り得ない 障害や事象の影響度 ◦ 知っている × 知り得ない × 知り得ない AWS マネジメントコン ソール ◦ 閲覧可能 ◦ 閲覧可能 ※⼀部例外あり1 × 閲覧不可能(閲覧しない) AWS で構築されたサーバ 内部のデータやログ ◦ 閲覧可能 × 閲覧不可 (ログインしない) × 閲覧不可 (ログインしない) AWS 物理基盤 × 閲覧不可 × 閲覧不可 ◦ 閲覧可能 1. サービスのポータルや操作画⾯の閲覧のために、IAM Identity Center によるユーザー管理となっているサービスの場合、その発⽣事象の閲覧ができない AWS サービスもある
  9. 41 それぞれがどの情報にアクセスできるか、知りうるか 対象 AWS 利⽤者 (お客様) (私の所属企業のような) パートナー企業 AWS テクニカルサポート

    設計背景や実装 ◦ 知っている × 知り得ない × 知り得ない 障害や事象の影響度 ◦ 知っている × 知り得ない × 知り得ない AWS マネジメントコン ソール ◦ 閲覧可能 ◦ 閲覧可能 ※⼀部例外あり1 × 閲覧不可能(閲覧しない) AWS で構築されたサーバ 内部のデータやログ ◦ 閲覧可能 × 閲覧不可 (ログインしない) × 閲覧不可 (ログインしない) AWS 物理基盤 × 閲覧不可 × 閲覧不可 ◦ 閲覧可能 1. サービスのポータルや操作画⾯の閲覧のために、IAM Identity Center によるユーザー管理となっているサービスの場合、その発⽣事象の閲覧ができない AWS サービスもある
  10. 44 考え⽅の⼀例 「いつなにがどうした」を整理する⽅法としてよく使われている 5W1H の スキームに、もう⼀つ How Much を追加して 5W2H

    として整理してみました。 あくまで、整理⽅法の⼀例ですし、私も書きながら「なにが」と「なにを」、 「なにに」をすべて What に詰め込めなくもないなぁと思ってしまったところ もありましたので、お客様組織内やプロジェクト内でアレンジいただいて良いか と思います。
  11. 45 考え⽅の⼀例 「いつなにがどうした」を整理する⽅法としてよく使われている 5W1H の スキームに、もう⼀つ How Much を追加して 5W2H

    として整理してみました。 あくまで、整理⽅法の⼀例ですし、私も書きながら「なにが」と「なにを」、 「なにに」をすべて What に詰め込めなくもないなぁと思ってしまったところ もありましたので、お客様組織内やプロジェクト内でアレンジいただいて良いか と思います。 ガチガチに決めておく必要まではないけど、 プロジェクトの担当者ごとで差異が⽣まれないように、とか いざ障害が発⽣したときに、まごまごしなくていいように、 ある程度フォーマット化しておくといいよね、くらいに捉えていただけると幸い です
  12. 46 5W2H の例 5W2H ⽬的 問い合わせ時の記載項⽬として考えられる事柄 When ・時間軸、頻度、継続の有無を伝える ・事象を観測できた⽇時 ・タイムゾーン

    ・観測した事象は1回のみか ・観測した事象は継続中か、収束しているか Where ・事象が発⽣している箇所を伝える ・事象が発⽣している AWS リソースの ID や ARN What ・何をした時に発⽣する(発⽣した) かを伝える ・すでに試してみていることがあれば 合わせて伝える ・<How>で伝える発⽣事象に対して、何をした時に発⽣ するのか。 あるいは何をした時には発⽣しないのか。 ・事象の解決を⽬的として、すでにやってみた⾏動はある か。 Who ・事象に関与する⼈物、モノ(操作主 体)の有無や詳細を伝える 上記の<What>に対し、関連するヒト・モノがあれば記載 する 例) ・操作主体(呼び出し元)としてのIAM ユーザーやロール ・操作主体(呼び出し元)としての Lambda など他の AWS サービス・リソース
  13. 47 5W2H の例 5W2H ⽬的 問い合わせ時の記載項⽬として考えられる事柄 Why ・発⽣事象をなぜ問題視しているかを 伝える ・実装しようとしている背景を伝える

    ・発⽣している事象において AWS の不具合・不備を疑うに ⾄った理由を伝える ・構築中や検討中などで想定するゴールのイメージに対し て、設計意図を伝える How ・どのような症状かを伝える 発⽣している事象を記載する。 例) ・接続ができない ・操作不能となる ・〇〇という結果となることを想定しているが△△となる How Much ・影響度はどの程度か伝える 事象が発⽣していることの業務への影響(ビジネスインパ クト)を記載する。 定量的な記載であればより客観的に判断が可能になる 例) ・〇〇⼈のユーザーのアクセスを処理することができず、 〇〇円/⽇の損失がある
  14. 51 Where, Who EC2 インスタンスの Name タグなど、タグの値は、同⼀の値を許容しうるため、 ⼀意に特定できる値としては適切とは⾔えません。 意識齟齬を⽣まないために、インスタンス ID

    や ARN など、⼀意となる値を使 ⽤することをお勧めいたします。 また、同様に意識齟齬を回避する⽬的で、お客様固有の俗称や略称の利⽤ (AWS が正式に⾏なっていない略称も含む)も避けることで、スムーズな共通 認識につながると考えます。
  15. 52 Where, Who EC2 インスタンスの Name タグなど、タグの値は、同⼀の値を許容しうるため、 ⼀意に特定できる値としては適切とは⾔えません。 意識齟齬を⽣まないために、インスタンス ID

    や ARN など、⼀意となる値を使 ⽤することをお勧めいたします。 また、同様に意識齟齬を回避する⽬的で、お客様固有の俗称や略称の利⽤ (AWS が正式に⾏なっていない略称も含む)も避けることで、スムーズな共通 認識につながると考えます。 また、通信経路や登場⼈物の把握のために構成図などの補⾜資料を共有いただけ ると理解が早まる点もありますので、複雑な構成をとっているような場合や被疑 箇所を明⽰したいような場合に添えていただけると幸いです。
  16. 53 Where, Who EC2 インスタンスの Name タグなど、タグの値は、同⼀の値を許容しうるため、 ⼀意に特定できる値としては適切とは⾔えません。 意識齟齬を⽣まないために、インスタンス ID

    や ARN など、⼀意となる値を使 ⽤することをお勧めいたします。 また、同様に意識齟齬を回避する⽬的で、お客様固有の俗称や略称の利⽤ (AWS が正式に⾏なっていない略称も含む)も避けることで、スムーズな共通 認識につながると考えます。 また、通信経路の把握に構成図を共有いただけると理解が早まる点もありますの で、複雑な構成をとっているような場合や被疑箇所を明⽰したいような場合に添 えていただけると幸いです。 余談ですが… SQL Server が関連するお問い合わせで RDS と記載されていた箇所を Amazon Relational Database Service と認識し対応していて、どうも話が⾷い違うな︖ と思ったところ、Windows Server リモートデスクトップサービス(RDS) のこ とだったと判明し、対応⽅針の変更を迫られた場⾯もありました。
  17. 62 テンプレート化の⼀例 AWS サポート ご担当者様 いつもお世話になっております。〇〇と申します。 〇〇について確認させてください。 (〇〇で△△という事象が発⽣しています。) ・発⽣した⽇時・タイムゾーン、発⽣頻度、事象の継続性 ・環境について(リソースID等含む)

    ・事象を観測した経緯、発⽣までの⼿順 ・既に調査したこと、およびその結果 ・なぜこの設計となっているか (なぜ本問い合わせ⽬的を達成したいのか) ・緊急度、業務への影響度について(定量的に書く) --- 以上、よろしくお願いいたします。