Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
そのSQL、もっと速くなりますよ。
Search
forcia_dev_pr
February 21, 2022
Programming
0
500
そのSQL、もっと速くなりますよ。
「FORCIA Meetup #4 高速検索を支えるPostgreSQLのノウハウ」の資料です
forcia_dev_pr
February 21, 2022
Tweet
Share
More Decks by forcia_dev_pr
See All by forcia_dev_pr
第8回ゆるふわオンサイト 解説スライド
forcia_dev_pr
0
43
第7回ゆるふわオンサイト解説
forcia_dev_pr
0
220
第6回ゆるふわオンサイト解説
forcia_dev_pr
0
230
よくわかるFORCIAのエンジニア旅行SaaSプロダクト開発編
forcia_dev_pr
0
730
よくわかるフォルシアのエンジニア 新卒採用編
forcia_dev_pr
0
3.6k
第5回ゆるふわオンサイト解説
forcia_dev_pr
0
160
よくわかるフォルシアのエンジニア 旅行プラットフォーム部編
forcia_dev_pr
0
6.4k
React hooks を気合で理解する
forcia_dev_pr
0
400
k8sマニフェストを Typescriptで管理したい― cdk8s+を導入してみました ―
forcia_dev_pr
0
370
Other Decks in Programming
See All in Programming
Feature Flag 自動お掃除のための TypeScript プログラム変換
azrsh
PRO
4
660
Interface vs Types ~型推論が過多推論~
hirokiomote
1
240
20250528 AWS Startupイベント登壇資料:AIコーディングの取り組み
procrustes5
0
120
イベントストーミングから始めるドメイン駆動設計
jgeem
3
710
Step up the performance game with Spring Boot and Project Leyden
mhalbritter
0
140
複雑なフォームを継続的に開発していくための技術選定・設計・実装 #tskaigi / #tskaigi2025
izumin5210
12
6.7k
TypeScript製IaCツールのAWS CDKが様々な言語で実装できる理由 ~他言語変換の仕組み~ / cdk-language-transformation
gotok365
7
400
UPDATEがシステムを複雑にする? イミュータブルデータモデルのすすめ
shimomura
0
400
テスト分析入門/Test Analysis Tutorial
goyoki
13
2.8k
MLOps Japan 勉強会 #52 - 特徴量を言語を越えて一貫して管理する, 『特徴量ドリブン』な MLOps の実現への試み
taniiicom
2
610
人には人それぞれのサービス層がある
shimabox
3
610
Efficiency and Rock 'n’ Roll (Really!)
hollycummins
0
650
Featured
See All Featured
Building an army of robots
kneath
306
45k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
30
2.1k
Testing 201, or: Great Expectations
jmmastey
42
7.5k
Product Roadmaps are Hard
iamctodd
PRO
53
11k
GitHub's CSS Performance
jonrohan
1031
460k
Thoughts on Productivity
jonyablonski
69
4.7k
The Pragmatic Product Professional
lauravandoore
35
6.7k
The Cult of Friendly URLs
andyhume
78
6.4k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.9k
4 Signs Your Business is Dying
shpigford
183
22k
Code Review Best Practice
trishagee
68
18k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
228
22k
Transcript
そのSQL、もっと速くなりますよ。 長尾 和昌 2022.02.15 FORCIA Meetup #4
自己紹介 • 長尾 和昌 (Kazumasa Nagao) • ソフトウェアエンジニア 旅行系アプリケーションの開発・保守 •
職歴 某電力会社の営業・経理 → プログラミング独学 → 起業 → 資金が底をつく → 就職 2
用語解説(バッチ処理とは) • オンライン処理のSQL エンドユーザーからのリクエストに応じて結果を返す。 数秒で完了する(べき)もの。 • バッチ処理のSQL 最新の料金在庫や商品情報などを顧客DBからコピーして 検索に必要な各種テーブルを作成する集中処理。
数十分で終わるものから数時間、なかには10時間を超えるものも。 3
バッチ処理のSQLの高速化に取り組む 4アプリケーションで計11時間短縮しました。 26.5時間 → 15.5時間(4アプリの合計) 4
高速化のノウハウを 4つ紹介させていただきます! 5
Case1. 1億レコードの超巨大テーブル 6
Case1. 1億レコードの超巨大テーブル 特に時間がかかっている処理をいくつか 調べたところ共通点が見つかりました。 7
Case1. 1億レコードの超巨大テーブル いつも同じテーブルが登場する。 8
Case1. 1億レコードの超巨大テーブル なんだこのテーブルは。 9
Case1. 1億レコードの超巨大テーブル SELECT count(*) FROM hoge1; -[ RECORD 1 ]-
count | 100000000 10
Case1. 1億レコードの超巨大テーブル でかい。 11
Case1. 1億レコードの超巨大テーブル これを見て疑問に思いました。 12
Case1. 1億レコードの超巨大テーブル このレコード、本当に全部使われているの? 13
Case1. 1億レコードの超巨大テーブル SQLをじっと眺めていると さらに共通点が見つかりました。 14
Case1. 1億レコードの超巨大テーブル hoge1 が使われるときは 必ず hoge2 もINNER JOIN されている。 (部屋IDにてJOIN)
15
Case1. 1億レコードの超巨大テーブル つまり hoge2 に存在しない部屋IDは 絶対に使われることがない。 ……と、いうことで試してみました。 16
Case1. 1億レコードの超巨大テーブル SELECT count(*) FROM hoge1 INNER JOIN hoge2 using
(部屋ID) ; -[ RECORD 1 ]- count | 8000000 17
Case1. 1億レコードの超巨大テーブル めっちゃ減った。 1億 → 800万 18
Case1. 1億レコードの超巨大テーブル hoge1 も hoge2 も顧客DBから取得した 生テーブルだったため、取得のタイミングで hoge1 に hoge2
をJOINして 不要なデータを落としました。 19
Case1. 1億レコードの超巨大テーブル これにより、hoge1 を使っている全ての SQLが爆速化しました。 計165分の大幅な短縮となりました。 20
Case1. 1億レコードの超巨大テーブル 【まとめ】 そのレコードは本当に使っているのか。 使っていないなら可能な限り上流で落とす。 21
Case2. WHERE句から条件を消したい 22
Case2. WHERE句から条件を消したい プレウォームが遅い。100分もかかる。 23
Case2. WHERE句から条件を消したい プレウォームとは バッチ処理の最後、サービス復帰の直前に 前もってよく投げられるクエリを発行し 結果をキャッシュに載せる。 24
Case2. WHERE句から条件を消したい 問題のSQLをいろいろいじっていて あることに気づきました。 25
Case2. WHERE句から条件を消したい SELECT * FROM hoge1 WHERE 方面 = ‘8’;
「方面=’8’」を消すと爆速化する。 26
Case2. WHERE句から条件を消したい これ消したい。 27
Case2. WHERE句から条件を消したい ただ、必要なので書かれているわけで 消したいからといって消せるもんじゃない。 28
Case2. WHERE句から条件を消したい 消したいなあ。でも消せないなあ。 29
Case2. WHERE句から条件を消したい あっ!!! 30
Case2. WHERE句から条件を消したい テーブルのほうを分ければよいのでは?! 31
Case2. WHERE句から条件を消したい 方面の数は有限なので もとのテーブル(hoge1)を hoge1_1, hoge1_2, hoge1_3 …… と分割しました。 32
Case2. WHERE句から条件を消したい SELECT * FROM hoge1 WHERE 方面 = ‘8’
↓ SELECT * FROM hoge1_8; 33
Case2. WHERE句から条件を消したい 重かった WHERE がなくなり プレウォームが100分から15分に短縮。 34
Case2. WHERE句から条件を消したい 【まとめ】 WHEREが重くて困ったら テーブルのほうを分けられるか確認する。 35
Case3. ループするSQLにご注意 36
Case3. ループするSQLにご注意 こんなSQLがありました。 37
Case3. ループするSQLにご注意 38 5回ループ { CREATE TABLE 新テーブル_{1~5} AS SELECT
hoge FROM Aテーブル INNER JOIN Bテーブル INNER JOIN Cテーブル INNER JOIN Dテーブル INNER JOIN Eテーブル_{1~5} ; }
Case3. ループするSQLにご注意 ん?なんか無駄じゃないか? 39
Case3. ループするSQLにご注意 40 CREATE TEMPORARY TABLE 一時テーブル AS SELECT hoge
FROM Aテーブル INNER JOIN Bテーブル INNER JOIN Cテーブル INNER JOIN Dテーブル ; 5回ループ { CREATE TABLE 新テーブル_{1~5} AS SELECT hoge FROM 一時テーブル INNER JOIN Eテーブル_{1~5} ; }
Case3. ループするSQLにご注意 これでB~DテーブルをJOINする回数が 5回から1回に減りました。 処理時間も当然ながら1/5ほどになりました。 41
Case3. ループするSQLにご注意 【まとめ】 ループさせるときは 本当にループすべきもの以外は 一時テーブルとして外だしする。 42
Case4. 理解不能な激ムズSQLでも速くしたい 43
Case4. 理解不能な激ムズSQLでも速くしたい なんだこのSQLは……読めん。 44
Case4. 理解不能な激ムズSQLでも速くしたい 45 SELECT 超複雑な処理 FROM ( SELECT 超複雑な処理 FROM
( SELECT 超複雑な処理 FROM ( -- かろうじて理解できた部分、ここから SELECT hoge FROM Aテーブル INNER JOIN Bテーブル INNER JOIN Cテーブル INNER JOIN Dテーブル INNER JOIN Eテーブル -- かろうじて理解できた部分、ここまで ) ) );
Case4. 理解不能な激ムズSQLでも速くしたい 階層深いし、ループしてるし SELECTのなかに独自実装の関数がいっぱい。 46
Case4. 理解不能な激ムズSQLでも速くしたい しかも処理が遅いのは まさにその超複雑な箇所でした。 47
Case4. 理解不能な激ムズSQLでも速くしたい この超複雑な箇所を直接触らずに しかもその箇所の速度を上げたい。 でも、そんなうまい話あるわけ…… 48
Case4. 理解不能な激ムズSQLでも速くしたい ANALYZE !! 49
Case4. 理解不能な激ムズSQLでも速くしたい かろうじて理解できた箇所を外だしして ANALYZEをかけた状態で 超複雑な処理を迎えるようにすれば…… 50
Case4. 理解不能な激ムズSQLでも速くしたい 51 CREATE TEMPORARY TABLE 一時テーブル AS SELECT hoge
FROM Aテーブル INNER JOIN Bテーブル INNER JOIN Cテーブル INNER JOIN Dテーブル INNER JOIN Eテーブル ; ANALYZE 一時テーブル; SELECT 超複雑な処理 FROM ( SELECT 超複雑な処理 FROM ( SELECT 超複雑な処理 FROM 一時テーブル ) );
Case4. 理解不能な激ムズSQLでも速くしたい たったこれだけで25%の高速化に成功しました。 52
Case4. 理解不能な激ムズSQLでも速くしたい 【まとめ】 困ったときのANALYZE 53
まとめ 54
まとめ • Case1. 1億レコードの超巨大テーブル そのレコードは本当に使っているのか。 使っていないなら可能な限り上流で落とす。 • Case2. WHERE句から条件を消したい WHEREが重くて困ったら
テーブルのほうを分けられるか確認する。 55
まとめ • Case3. ループするSQLにご注意 ループさせるときは 本当にループすべきもの以外は 一時テーブルとして外だしする。 • Case4. 理解不能な激ムズSQLでも速くしたい
困ったときのANALYZE 56
さいごに 今回ご紹介させていただいたノウハウは いずれもトリッキーな技術ではなく 「なんだそんな単純なことか」 「そんなこと既にできているに決まっている」 と思われるようなものも多々あったかと思います。 57
さいごに ただ、ひとつのSQLが数百行数千行あったとしたら どうでしょうか。 その中にたった数行問題のある重い処理が存在する ということは十分にあり得ることだと思います。 そして、それを探し出すのがSQLチューニングの 楽しさかなと思います。 58
ご清聴ありがとうございました! 59