Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLMOpsのパフォーマンスを支える技術と現場で実践した改善
Search
po3rin
August 15, 2025
Programming
1.2k
8
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LLMOpsのパフォーマンスを支える技術と現場で実践した改善
po3rin
August 15, 2025
More Decks by po3rin
See All by po3rin
検索設計から 推論設計への重心移動と Recall-First Retrieval
po3rin
5
1.9k
LLMで複雑な検索条件アセットから脱却する!! 生成的検索インタフェースの設計論
po3rin
4
1.4k
C-Shared Buildで突破するAI Agent バックテストの壁
po3rin
0
500
嗚呼、当時の本番環境の状態で AI Agentを再評価したいなぁ...
po3rin
0
590
Temporal Knowledge Graphで作る! 時間変化するナレッジを扱うAI Agentの世界
po3rin
7
2.3k
自作LLM Native GORM Pluginで実現する AI Agentバックテスト基盤構築
po3rin
2
1.1k
麻雀点数計算問題生成タスクから学ぶ Single Agentの限界と Agentic Workflowの底力
po3rin
5
3.1k
LLMは麻雀を知らなすぎるから俺が教育してやる
po3rin
5
2.9k
M3におけるCI/CDパイプラインを新鮮に保つ仕組み
po3rin
0
440
Other Decks in Programming
See All in Programming
コンテキストの使い捨てをやめる — ビジネスルール駆動開発と miko —
ioki
0
160
RTSPクライアントを自作してみた話
simotin13
0
510
決定論的オーケストレーションの設計と実装 / Design and Implementation of Deterministic Orchestration
nrslib
3
1.2k
今さら聞けないCancellationToken
htkym
0
220
肥大化するレガシーコードに立ち向かうためのインターフェース分離と依存の逆転 / JJUG CCC 2026 Spring
hirokunimaeta
0
510
TypeScript+Orvalで実現する型安全かつ堅牢でスケーラブルなマルチチャネル通知基盤 / TSKaigi Night talks ~after conference~
d0riven
0
310
Hunting Vulnerabilities in Symfony with LLMs
vinceamstoutz
0
310
技術記事、AIに書かせるか、自分で書くか? 〜それでも私が自分の手で書く理由〜 / #QiitaConference
jnchito
2
1.3k
不変条件と整合性境界—ビジネスが決める設計判断と実現パターン / Invariants and Consistency Boundaries
nrslib
13
3.5k
CSC307 Lecture 17
javiergs
PRO
0
320
dRuby over BLE
makicamel
2
320
フロントエンドとバックエンドで「1文字」を揃えよう
youkidearitai
PRO
0
220
Featured
See All Featured
Faster Mobile Websites
deanohume
310
31k
Mobile First: as difficult as doing things right
swwweet
225
10k
Rails Girls Zürich Keynote
gr2m
96
14k
WENDY [Excerpt]
tessaabrams
11
38k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.6k
Side Projects
sachag
455
43k
The agentic SEO stack - context over prompts
schlessera
0
800
Darren the Foodie - Storyboard
khoart
PRO
3
3.4k
Producing Creativity
orderedlist
PRO
348
40k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
160
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.8k
Transcript
)JSPNV/BLBNVSBQFSGUPLZP --.0QTͷύϑΥʔϚϯεΛࢧ͑Δٕज़
)JSPNV/BLBNVSB )JSPNV /BLBNVSB QPSJO "*.-0QT&OHJOFFS*OUFSFTUJOH JO*OGPSNBUJPO3FUSJFWBM
-BZFS9ͷ--.0QT
-BZFS9ݱࡏ"*"HFOUΛΰϦΰϦ ਐΊ͍ͯΔ https://layerx.co.jp/news/20250401/
--.0QTॏཁج൫ ϓϩϯϓτόʔδϣϯཧ --.࣮ߦ࣌ͷτϨʔεͳͲͷΦϒβʔόϏϦςΟ Ϟσϧ͝ͱͷਫ਼ݕূ ධՁσʔληοτཧ ࣮ݧͷཧ
-BOHGVTFΠϯϑϥߏ w Ϋϥυ൛ͱηϧϑϗετ൛͕͋Δ w Ϋϥυ൛ຊϦʔδϣϯ͕ͳ͘ɺσʔλཧͷ؍͔ΒηϧϑϗετΛબ w σʔλετΞͱͯ͠1PTUHSF42- 4 $MJDL)PVTF Λ༻͍Δ
$MJDL)PVTFͱ Φʔϓϯιʔεͷੳ͚ 0-"1 ྻࢦσʔλϕʔε -BOHGVTFτϨʔε݁Ռͷ֨ೲઌͱͯ͠ར༻ ॻ͖ࠐ·ΕͨσʔλϒϩοΫετϨʔδͰอ͞ΕΔ "84ͷ߹&'4ͳͲ ࠓճ&'4Λ࠾༻ ෳαʔόʹΑΔΫϥελߏʹରԠ
ΞʔΩςΫνϟ -BOHGVTF "-#ܦ༝ͷ&$4PO'BSHUFB ୯Ұͷ&$44FSWJDFɺ"VUP4DBMJOH༗ޮԽ $MJDL)PVTF /-#ܦ༝ͷ&$4PO'BSHUFB αʔό͝ͱʹݸผͷ&$44FSWJDFΛ࡞ ෦௨৴ϩʔυόϥϯαΛڬ·ͣ௨৴
ͱվળ
ແࣄՔಇʂͱࢥͬͨΒʜ • ຖͷΑ͏ʹλεΫ͕ෆ҆ఆͳঢ়ଶʹ • Langfuse ͕τϨʔεΛهͰ͖ͳ͔ͬͨͱΤϥʔΛు͘ • Max attempts reached
for * record. Dropping record. • େྔͷHTTPλΠϜΞτ • ClickhouseWriter.writeToClickhouse Error: Timeout error.
$16.FNPSZ·ͩ༨༟͕͋Δ
"*ωοτϫʔΫͷͩͱݴ͍ுͬͯΔ ωοτϫʔΫͷͰ͠ΐ͏ʂʂʂ ͔͠͠ɺ֤λΠϜΞτઃఆΛ֬ೝͯ͠ɺͳͦ͞͏ɻ ͦͦT͔͚ͯτϨʔεʹॻ͖ࠐΊͳ͍%#͕͓͔͍͠ɻ
&'4ͷΛൃݟ w 5ISPVHIQVUVUJMJ[BUJPO͕ৗʹߴ͍͜ͱ͕ൃ֮
&'45ISPVHIQVUNPEFʹ͍ͭͯ w 5ISPVHIQVUVUJMJ[BUJPO͕ৗʹߴ͍͜ͱ͕ൃ֮ • EFS ʹεϧʔϓοτϞʔυ͕3छྨ͋Γɺཁ݅ʹ߹ΘͤͯબՄೳ • Elastic: ར༻ঢ়گʹ߹Θͤͯࣗಈతʹεέʔϧ •
Bursting: ετϨʔδ༻ྔʹൺྫͯ͠εϧʔϓοτ૿͑Δ • Provisioned: ࢦఆͨ͠εϧʔϓοτྔΛݻఆͰ֬อ • ֘ͷ EFS Bursting ʹͳ͍ͬͯͨ • ͍࢝Ί͔ͨΓͰ༻ྔ 3~4GiB ΄Ͳ • ετϨʔδ 1GiB ͋ͨΓ 50KiBps ͷεϧʔϓοτ → 200KiB/s ΄Ͳ͔͠ͳ͍
&'45ISPVHIQVUNPEFͷมߋ • Bursting → Elastic มߋͯ͠ঢ়گ͕վળͨ͠ • AWS ίϯιʔϧͷॳظ Elastic
• Terraformaws provider ͷॳظ Bursting ͳ͜ͱΛݟམͱ͍ͯͨ͠ (ຌϛε)
$MJDL)PVTF%FFQ%JWF
$MJDL)PVTFͷύϑΥʔϚϯεΛࢧ͑Δٕज़ w τϨʔεͷॻ͖ࠐΈͰΤϥʔ͕ൃੜ͍ͯͨͨ͠ΊɺͦͷลͷڍಈΛௐࠪ͠·ͨ͠ɻ
$MJDL)PVTFͷύϑΥʔϚϯεΛࢧ͑Δٕज़ • InsertΛड͚ΔͱɺPartͱ͍͏୯ҐͰ σʔλΛ֨ೲ͢Δɻ • ҰؾʹInsert͢ΔͷͰͳ͘ɺҰ Bufferʹ֨ೲ͢Δ͜ͱͰɺલͬͯ σʔλΛιʔτͯ֨͠ೲ͢Δɻ
$MJDL)PVTFͷύϑΥʔϚϯεΛࢧ͑Δٕज़ • PartΛ࡞ΔࡍʹσʔλΛιʔτ͠ɺΧϥ Ϝʹ͚ͯΠϯσοΫεใͱڞʹPartͱ ͯ͠อଘ • ιʔτ͢Δ͜ͱʹΑΓɺΠϯσοΫεใ ͔ΒͲͷϑΝΠϧʹඞཁͳσʔλ͕֨ೲ͞ Ε͍ͯΔ͔͕ܭࢉ͘͢͠ͳ͍ͬͯΔɻ
$MJDL)PVTFͷύϑΥʔϚϯεΛࢧ͑Δٕज़ Compress columnsͰɺgranuleͱ͍͏୯ҐʹσʔλΛ͚ɺprimary.idxͱ͍͏ϑΝΠϧʹ Ͳͷൣғͷσʔλ͕͋Δ͔Λอଘ͓ͯ͘͜͠ͱͰɺߴͳσʔλΞΫηεΛ࣮ݱ͍ͯ͠Δɻ
MarkΧϥϜ͝ͱʹ࡞ΒΕอଘͨ͠granuleͷॴΛḷΓ͘͢͢Δ $MJDL)PVTFͷύϑΥʔϚϯεΛࢧ͑Δٕज़
$MJDL)PVTFͷύϑΥʔϚϯεΛࢧ͑Δٕज़ ϨϓϦέʔγϣϯ࣌ʹ࣍ͷσʔλΛૹ৴͢Δඞཁ͕͋Γ·͢ɻ w ΧϥϜσʔλϑΝΠϧ DPMVNO@OBNFCJOܗࣜͷѹॖ͞Εͨσʔλ w ΠϯσοΫεϑΝΠϧ QSJNBSZJEYͳͲͷϓϥΠϚϦΩʔΠϯσοΫε w
ϚʔΫϑΝΠϧ DPMVNO@OBNFNSLͳͲͷߦҐஔϚʔΧʔ w ϝλσʔλϑΝΠϧ DIFDLTVNTUYU DPMVNOTUYUͳͲͷύʔπهड़ใ
$MJDL)PVTFͷύϑΥʔϚϯεΛࢧ͑Δٕज़ 1BSUTͷϚʔδఆظతʹൃੜ͠·͢ɻ ϑΝΠϧγεςϜ͜ΕΛఆͯ͠ε ϧʔϓοτΛ֬อ͢Δඞཁ͕͋ͬͨɻ
$MJDL)PVTFͷύϑΥʔϚϯεΛࢧ͑Δٕज़ • ClickHouseͰϨϓϦέʔγϣϯɺϚʔδͱ͍ͬͨඇಉظॲཧ͕ൃੜ͠·͢ɻ • ϨϓϦέʔγϣϯ࣌ʹɺ͜ͷPartsΛHTTPܦ༝ͰϨϓϦέʔγϣϯ͢Δͨ ΊɺωοτϫʔΫεϧʔϓοτؾΛ͚ͭΔඞཁ͕͋Δɻ • ࠓճͷ߹ωοτϫʔΫͷλΠϜΞτΑΓɺϑΝΠϧγεςϜͷλΠϜ Ξτ͕͘ઃఆ͞Ε͍ͯͨͷ͕ࠜຊͷʹؾ͖ͮʹ͍͘ݪҼͰͨ͠ɻ
·ͱΊ
"*ʹฉ͚ͩ͘ͰΘ͔Βͳ͍ࠜຊݪҼ༨༟Ͱଘࡏ͢Δ ύϑΥʔϚϯεͷݟɺΠϯϑϥࣝɺΞϧΰϦζϜͷࣝҾ͖ଓ͖ඞ ཁɻֶΜͰ͍͖·͠ΐ͏ʂʂʂʂ
"*࣌Ͱ%FFQ%JWF͢Δ͜ͱՁ ཪଆͰಈ͍͍ͯΔॲཧΛ۩ମతʹΔ͜ͱͰɺύϑΥʔϚϯεɺ҆ఆੑΛ্͛Δͱ ͖ʹͲ͜ʹΛ͚ͭΕྑ͍ͷ͔ͷௐ͕ࠪඇৗʹ͘͢͠ͳͬͨɻ ϩάϝτϦΫε͚ͩΛݟͯରԠΛ૾͢ΔͷͰͳ͘ɺ࣮ࡍʹཪଆΛཧղ͢Δ͜ ͱͰɺ֬৴Λ࣋ͬͨࠜຊղܾ͕Ͱ͖ΔΑ͏ʹͳͬͨɻ
ϒϩάʹͯ͠·͢ʂʂ tech.layerx.co.jp/entry/deep-dive-clickhouse
)JSPNV/BLBNVSBQFSGUPLZP --.0QTͷύϑΥʔϚϯεΛࢧ͑Δٕज़ͱ ݱͰ࣮ફͨ͠վળ