Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
エンジニアでも論文が読みたい!
Search
Honahuku
October 17, 2024
Technology
0
500
エンジニアでも論文が読みたい!
PIXIV DEV MEETUP 2024 での発表資料です
https://conference.pixiv.co.jp/2024/dev-meetup
Honahuku
October 17, 2024
Tweet
Share
More Decks by Honahuku
See All by Honahuku
大規模コンピューティングを支える Kubernetes のネットワーク
honahuku
0
44
今から始める分散システム
honahuku
0
250
SecAd~Ad data drivin’ network security~
honahuku
0
140
Other Decks in Technology
See All in Technology
私なりのAIのご紹介 [2024年版]
qt_luigi
1
120
サービスでLLMを採用したばっかりに振り回され続けたこの一年のあれやこれや
segavvy
2
430
20241214_WACATE2024冬_テスト設計技法をチョット俯瞰してみよう
kzsuzuki
3
450
終了の危機にあった15年続くWebサービスを全力で存続させる - phpcon2024
yositosi
11
9.9k
TSKaigi 2024 の登壇から広がったコミュニティ活動について
tsukuha
0
160
小学3年生夏休みの自由研究「夏休みに Copilot で遊んでみた」
taichinakamura
0
150
社内イベント管理システムを1週間でAKSからACAに移行した話し
shingo_kawahara
0
190
20241220_S3 tablesの使い方を検証してみた
handy
4
460
Snykで始めるセキュリティ担当者とSREと開発者が楽になる脆弱性対応 / Getting started with Snyk Vulnerability Response
yamaguchitk333
2
180
宇宙ベンチャーにおける最近の情シス取り組みについて
axelmizu
0
110
サイバー攻撃を想定したセキュリティガイドライン 策定とASM及びCNAPPの活用方法
syoshie
3
1.3k
KnowledgeBaseDocuments APIでベクトルインデックス管理を自動化する
iidaxs
1
260
Featured
See All Featured
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
26
1.9k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5.1k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
8
1.2k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
247
1.3M
How To Stay Up To Date on Web Technology
chriscoyier
789
250k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.2k
Being A Developer After 40
akosma
87
590k
What's in a price? How to price your products and services
michaelherold
243
12k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
28
900
Building Adaptive Systems
keathley
38
2.3k
Agile that works and the tools we love
rasmusluckow
328
21k
Transcript
エンジニアでも論文が 読みたい! Honahuku
アドプラットフォーム事業部/ アド・プロダクト部/ 広告なんでもチーム エンジニア Honahuku
今回話さないこと • 論文の読み方 • 具体的な研究のいろは・進め方
今回話すこと • エンジニアリングと研究の似ているところ • エンジニアリングに活かせるアカデミックなアプローチ • 私の活用事例
研究,やってますか 私は最近全然できてません
研究ってなんだよ • 事業会社でエンジニアをしながら研究をしている人は多 くないと思う • しかしエンジニアリングに研究の考え方が生きることが ある
エンジニアリングの手法 • 技術選定 ◦ 他社の事例や業界動向など複数の要素から意思決定 • 新環境の負荷試験 • ポストモーテム・プレモーテム •
課題解決
研究の手法 • 技術選定 ◦ 他社の事例や業界動向など複数の情報を収集 • 新環境の負荷試験 • ポストモーテム・プレモーテム •
課題解決 先行研究の調査 実験 結果考察 研究目的
研究のモチベーション • 研究とエンジニアリングは似ている点もあるが、異なる 点も多い • 仮に同じ目的があったとしても『研究』と『エンジニア リング』はアプローチが異なるはず
アカデミックなアプローチ • 論文というフォーマット ◦ 序章(背景)、手法、実験、考察、結論 ◦ 論文を読み、ディスカッションを重ね、検討し、より 良い案を提案する
アカデミックなアプローチ • 信頼度と情報ソース ◦ 単なる妄想は学問とは言えない ◦ 知識の積み上げ(先行研究)、情報ソースは重要
なぜ Honahuku は 論文を読むのか
自分の領域へ普段と違う 切り口から切り込むと嬉しい
何が嬉しいかというと 論文という別角度のデータソースから より理解を深めることが出来る
何が嬉しいかというと • why に切り込んだ背景知識を得られる • 関連する課題や手法へのインデックスを貼れる • 局所最適な手法に囚われすぎない
Honahuku のケース • 属人性が高くなんとなくで動いているインフラへの 問題意識 • プロダクトの可用性だけでなく可観測性と回復力を 高める取り組みを考えていた
論文紹介 • MS の SRE に関する論文 ◦ インシデント検知の問題点 ▪ モニターの不足によるインシデントの対応遅れ
▪ 不要なモニターによるオオカミ少年なアラート ◦ サービスに対する監視を分析し、改善手法の実証実験を 行った[ganatra2023] • [ganatra2023]: Detection is better than cure: A cloud incidents perspective, https://doi.org/10.1145/3611643.3613898
監視とインシデント対応 • モニターの不足はインシデント対応遅れや連鎖的な障害発 生に繋がる • 検出までの時間(Time to Detect)は シグナルやアラートが欠落していると最大 •
障害対応時間(Time to Mitigate)はモニター についてのドキュメントに欠落・誤りがある と伸びる
カスケード障害 • DBが停止するインシデントが発生したとする ◦ エンキューに時間がかかりジョブが詰まる ▪ DB停止に気づけてもキューのスタック検知のアラート が無ければ障害時間の増加がありえる ▪ システムの全容を把握している人や経験豊富な人は気
付ける可能性が高い
カスケード障害 • DBが停止するインシデントが発生したとする ◦ エンキューに時間がかかりジョブが詰まる ▪ DB停止に気づけてもキューのスタック検知のアラート が無ければ障害時間の増加がありえる ▪ システムの全容を把握している人や経験豊富な人は気
付ける可能性が高い そうでない人は?
モニターの見直し • モニターは過去の障害発生を元に追加されてきた ◦ 場当たり的なモニター追加は欠落や重複を招くのでは? • 賢いモニタリングフレームワークはモニター追加や重複削除 の提案をしてくれそう ▪ インシデントを学習(ML)させて提案に使う
Honahuku のケース • 属人性が高くなんとなくで動いているインフラへの 問題意識 • プロダクトの可用性だけでなく回復力と可観測性を 高める取り組みを考えていた
チームへの適用 • 同じように不要なモニターが無いか、見落としているメト リクスは無いかを洗い出し • 残った必要なモニターに対してアラートロジックとドキュ メントに誤りが無いかを確認することをPJに盛り込む
チームへの適用 • 同じように不要なモニターが無いか、見落としているメト リクスは無いかを洗い出し • 残った必要なモニターに対してアラートロジックとドキュ メントに誤りが無いかを確認することをPJに盛り込む 論文を元にした対応方針の検討
アカデミックなアプローチで より快適な エンジニアリングライフを!