Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
【Ottertune】MLでDBを最適化するツールの紹介
Search
Hank Ehly
August 25, 2022
Technology
1
970
【Ottertune】MLでDBを最適化するツールの紹介
Hank Ehly
August 25, 2022
Tweet
Share
More Decks by Hank Ehly
See All by Hank Ehly
Fivetranでデータ移動を自動化する
hankehly
0
480
Celeryの紹介と本番運用のTips
hankehly
0
590
ChatGPTを活用した 便利ツールの紹介
hankehly
1
1.2k
Efficient Energy Analytics with Airflow, Spark, and MLFlow
hankehly
0
240
Deferrable Operators入門
hankehly
0
440
【初心者/ハンズオン】Dockerコンテナの基礎知識
hankehly
0
410
Compositeパターン: オブジェクトの階層関係をエレガントに表現する方法
hankehly
0
270
10/29 Airflowの基礎を学ぶハンズオンワークショップ
hankehly
0
210
システム/データ品質保証のための Airflow 活用法
hankehly
0
510
Other Decks in Technology
See All in Technology
論文紹介 ”Long-Context LLMs Meet RAG: Overcoming Challenges for Long Inputs in RAG” @GDG Tokyo
shukob
0
240
オーティファイ会社紹介資料 / Autify Company Deck
autifyhq
10
120k
SREとしてスタッフエンジニアを目指す / SRE Kaigi 2025
tjun
14
4.9k
企業テックブログにおける執筆ネタの考え方・見つけ方・広げ方 / How to Think of, Find, and Expand Writing Topics for Corporate Tech Blogs
honyanya
0
680
reinvent2024を起点に振り返るサーバーレスアップデート
mihonda
1
170
第27回クラウド女子会 ~re:Invent 振り返りLT会~ 宣言型ポリシー、使ってみたらこうだった!
itkr2305
0
270
Plants vs thieves: Automated Tests in the World of Web Security
leichteckig
0
140
ブロックチェーンR&D企業における SREの実態 / SRE Kaigi 2025
datachain
0
3.2k
やっちゃえ誤自宅Nutanix
yukiafronia
0
330
フラット構造をやめた理由と、EM / Tech Leadを作った理由
baroqueworksdev
0
380
[SRE kaigi 2025] ガバメントクラウドに向けた開発と変化するSRE組織のあり方 / Development for Government Cloud and the Evolving Role of SRE Teams
kazeburo
3
1.5k
横断SREの立ち上げと、AWSセキュリティへの取り組みの軌跡
rvirus0817
3
3.6k
Featured
See All Featured
Building a Scalable Design System with Sketch
lauravandoore
460
33k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
Code Review Best Practice
trishagee
65
17k
StorybookのUI Testing Handbookを読んだ
zakiyama
28
5.4k
A Tale of Four Properties
chriscoyier
157
23k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
33
2.7k
Designing on Purpose - Digital PM Summit 2013
jponch
117
7.1k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
11
890
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
113
50k
A Philosophy of Restraint
colly
203
16k
KATA
mclloyd
29
14k
Transcript
【Ottertune】MLでDBを最適化する ツールの紹介
自己紹介 • Hank Ehly (ハンク イーリー) • ENECHANGE株式会社 • qiita.com/hankehly
• github.com/hankehly • connpass.com/user/hankehly
アジェンダ 1. DBチューニングの問題点 2. OtterTuneとは 3. 営業とのQ&A
AWS RDSとは • マネージド PostgreSQL、MySQL、... • バージョン更新 / バックアップ等 自動化される
• デフォルトパラメータ • DBの使われ方に最適化されていない
DBチューニングの問題点 • RDBの費用を抑えて性能を最適化したいよね? (A) PostgreSQLの内部の専門的な知識 (B) 試行錯誤でパラメータ変更を繰り返し、最適化されるまで、パフォーマンスへの 影響を検証する時間 (私はどちらも持っていない) •
本来より高いクラウドコストを支払っていて、低いパフォーマンスしか出せていない
OtterTuneとは AWS の RDS と連携し、PostgreSQL と MySQL の設定項目を機械学習で最適化する SaaS プロダクト
1. 接続 • OtterTuneアカウント作成 • Agentをデプロイする 2. メトリック取得 • DB のハードウェア、パラメータ、メトリクス情報を 定期的に取得する • データやクエリーを見ない 3. 最適化 • ユーザーが設定した目標に向けて、 DB の設定を機械学習で最適化していく
①今この設定だよ ②多分これに変えたら パフォーマンス上がるよ ③どうする?
営業とのQ&A 1. どんな情報を取得するか • 数値、カウンター、レイテンシー情報 • PostgreSQL Statistics Collector •
CloudWatchメトリック(CPU使用率など) • クエリーの内容/スキーマは取得されません 2. RDSとどう接続するか • Agentをデプロイする(Fargate) • 公式 CloudFormation / Terraform
module "ottertune-iam" { source = "ottertune/ottertune-iam/aws" version = "0.0.6" external_id
= "***" } (Terraform)
営業とのQ&A 3. 設定変更によるダウンタイムはあるか • 設定変更によるダウンタイムは今まで発生したことがないそうです • 変更すると再起動が必要な設定はあるけど、事前に分かるもののみ 4. 日本語対応(ダッシュボード /
サポート等) ない 5. 設定変更は自動なのか、人がやるのか • どちらも対応している • 完全に自動化できる • 人間が変更内容を見てボタンクリックで適用することもできる(human in the loop と呼ぶ)
営業とのQ&A 6. 設定変更はどの頻度で行われるか • 調整できるけど、24時間に1回が推奨される • 大体20回目のイテレーションで、パフォーマンスチューニングがMAXに到達する
営業とのQ&A 7. どのくらいのパフォーマンス向上が期待できるか ワークロードによるけど、デフォルトの RDS 設定を使っている場合 5% 〜 15% は期待
できる
営業とのQ&A 8. PostgreSQL のバージョン変更したらどうなるか • 何もなかったように、新しいメトリック/設定項目を考慮範囲に含められるだけ • OtterTuneのサービスが途切れることはない 9. 設定変更によってパフォーマンスが下がったことはあるか?
• あるけど、最初の方だけで、ノイズに近い • 継続的な設定調整でパフォーマンスがだんだん悪くなることはない 10. でもお高いでしょ? • 1 db = $0 • 〜5 db = $450/月 • https://ottertune.com/pricing 11. 検証環境で学習させて本番環境に適用することは? • 環境によってワークロードが違うので、検証環境で学習させて、本番環境に変更を展開することはあまり意味がない
営業とのQ&A 12. どのDBがサポートされるか
13. どのパラメータを調整するか • autovacuum_vacuum_cost_delay • autovacuum_vacuum_cost_limit • autovacuum_vacuum_scale_factor • autovacuum_vacuum_threshold
• bgwriter_delay • bgwriter_lru_maxpages • bgwriter_lru_multiplier • checkpoint_completion_target • 等々 営業とのQ&A
ご清聴ありがとうございます