Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLMアプリをRagasで評価して、Langfuseで可視化しよう!
Search
みのるん
PRO
October 27, 2024
Technology
7
1.3k
LLMアプリをRagasで評価して、Langfuseで可視化しよう!
【生成AI/LLM LT大会】今注目している技術や最新動向を共有!
https://blueish.connpass.com/event/333518/
みのるん
PRO
October 27, 2024
Tweet
Share
More Decks by みのるん
See All by みのるん
地味にいろいろあった! 2025春のAmazon Bedrockアップデートおさらい
minorun365
PRO
2
550
30代からでも遅くない! 内製開発の世界に飛び込み、最前線で戦うLLMアプリ開発エンジニアになろう
minorun365
PRO
16
5k
やさしいMCP入門
minorun365
PRO
171
120k
マネコン操作いらず! TerraformでAWSインフラのコーディングに入門しよう
minorun365
PRO
6
2.1k
Qiita Organizationを導入したら、アウトプッターが爆増して会社がちょっと有名になった件
minorun365
PRO
2
690
AI自体のOps 〜LLMアプリの運用、AWSサービスとOSSの使い分け〜
minorun365
PRO
11
1.9k
AIエージェント入門
minorun365
PRO
48
25k
まだ間に合う! エンジニアのための生成AIアプリ開発入門 on AWS
minorun365
PRO
6
1.1k
AWSの生成AIサービス Amazon Bedrock入門!(2025年1月版)
minorun365
PRO
9
1.5k
Other Decks in Technology
See All in Technology
SREからゼロイチプロダクト開発へ ー越境する打席の立ち方と期待への応え方ー / Product Engineering Night #8
itkq
2
1.1k
日経電子版 for Android の技術的課題と取り組み(令和最新版)/android-20250423
nikkei_engineer_recruiting
1
610
Dynamic Reteaming And Self Organization
miholovesq
3
740
Perl歴約10年のエンジニアがフルスタックTypeScriptに出会ってみた
papix
1
260
AIとSREで「今」できること
honmarkhunt
3
690
LLM アプリケーションのためのクラウドセキュリティ - CSPM の実装ポイント-
osakatechlab
0
160
OpenLane-V2ベンチマークと代表的な手法
kzykmyzw
0
150
コードや知識を組み込む / Incorporating Codes and Knowledge
ks91
PRO
0
160
SnowflakeとDatabricks両方でRAGを構築してみた
kameitomohiro
1
570
LT Slide 2025-04-22
takesection
0
110
今日からはじめるプラットフォームエンジニアリング
jacopen
8
1.9k
MCPを理解する
yudai00
12
9.1k
Featured
See All Featured
A Tale of Four Properties
chriscoyier
158
23k
Building a Modern Day E-commerce SEO Strategy
aleyda
40
7.2k
Designing Experiences People Love
moore
142
24k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
780
Code Review Best Practice
trishagee
67
18k
Adopting Sorbet at Scale
ufuk
76
9.3k
Designing for humans not robots
tammielis
253
25k
Producing Creativity
orderedlist
PRO
344
40k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Rails Girls Zürich Keynote
gr2m
94
13k
Docker and Python
trallard
44
3.4k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
23
2.7k
Transcript
ΈͷΔΜ !NJOPSVO --.ΞϓϦΛ 3BHBTͰධՁͯ͠ -BOHGVTFͰՄࢹԽ͠Α͏ʂ
XIPBNJ ޚా ູʢΈͷΔΜʣ!NJOPSVO ςοΫΤόϯδΣϦετ ,%%*ΞδϟΠϧ։ൃηϯλʔגࣜձࣾʢ,"(ʣ +"846(ӡӦ ౦ژࢧ෦ 43&ࢧ෦ /8+"84 •
"84$PNNVOJUZ)FSP • "844BNVSBJ • +BQBO"845PQ&OHJOFFS • +BQBO"84"MM$FSUT&OHJOFFS
Έͳ͞Μɺ --.ΞϓϦ࡞ͬͯ·͔͢ʁ
ͦΖͦΖɺ3"(νϟοτϘοτͷ1P$ ͖͖ͯͨํ͍ΔͷͰʜʁ
ੜ"*ΞϓϦͷ1P$Λଔۀͯ͠ ຊ൪ӡ༻ਐΉͨΊʹ ͔ܽͤͳ͍ཁૉͱ͍͑ʜ
ੜ"*ΞϓϦͷ1P$Λଔۀͯ͠ ຊ൪ӡ༻ਐΉͨΊʹ ͔ܽͤͳ͍ཁૉͱ͍͑ʜ ࢹͱධՁʂ
ᶃ ࢹฤ
ͱ͋ΔΞδϟΠϧ։ൃاۀͷ ΤϯδχΞɺΧάΧά͘Μ 3"(νϟοτϘοτΛߏங͠·ͨ͠
͋Δɺ͓٬͞·͔Β࿈བྷ͕ʜ ࠷ۙɺࣾһ͔Β ʮճ࣭͕མͪͨʯ ͱ͍͏ਃࠂ͕ ૿͍͑ͯΔΜͰ͕͢ʜ
͔֬ʹɺલਖ਼Ͱ͖͍ͯͨࣾφϨοδ2"ʹ ޡ͢ΔΑ͏ʹͳ͍ͬͯΔ ,"(ࣾͷ ެࣜΏΔΩϟϥʁ ʢώϯτɿௗྨʣ ΧάόʔυͰ͢ʢେӕʣ
͍͍ͬͨྼԽՕॴͲͩ͜Ζ͏ʜ ϓϩϯϓτ ςϯϓϨʔτ ݕࡧΫΤϦʔ ݕࡧ݁Ռ ճੜ
ϓϩϯϓτͱੜ݁Ռ͚ͩͰΘ͔Βͳ͍ʂ ,"(ࣾͷϚείοτ ΩϟϥΫλʔʁ ʢώϯτɿௗྨʣ ΧάόʔυͰ͢ʢେӕʣ ॾʑͷॲཧ
͔ͱ͍ͬͯɺຖճϩάړΔͷ͍ͩͿਏ͍ʜ
҆৺͍ͯͩ͘͠͞ɺ --.ΞϓϦઐ༻ͷ ࢹπʔϧ͕͋Γ·͢Α
༗໊ͳ--.ΞϓϦࢹπʔϧ -BOH$IBJO͕ࣾఏڙɻ 4BB4͕ͩɺ՝ۚ͢Ε ηϧϑϗετՄೳ -BOH4NJUI෩ͷػೳΛ 044ͱͯ͠ެ։ɻ खܰʹࣗڥͰಈ͔ͤΔ
ࠓճܖͳ͠ͰࢼͤΔ-BOHGVTFΛհ -BOH$IBJO͕ࣾఏڙɻ 4BB4͕ͩɺ՝ۚ͢Ε ηϧϑϗετՄೳ -BOH4NJUI෩ͷػೳΛ 044ͱͯ͠ެ։ɻ खܰʹࣗڥͰಈ͔ͤΔ
ίϯςφͱ%#͕༻ҙͰ͖Ε0,ɻ "84ͳΒ"QQ3VOOFSʴ3%4ͳͲ "84ΞΧϯτ "QQ3VOOFS 3%4 GPS1PTUHSF42- -BOHGVTF αʔόʔ σʔλϕʔε
ΞϓϦͷܭ؆୯ʂ ᶃ ڥมʹೝূΩʔͱαʔόʔ63-Λઃఆ ᶄ ࢹ͍ͨؔ͠ΛσίΔ PS-BOH$IBJOͳΒίʔϧόοΫΛ͢ Ҏ্ʂ FOW -"/('64&@4&$3&5@,&: -"/('64&@16#-*$@,&:
-"/('64&@)045
ܭޙɺ࣮ࡍʹΞϓϦΛಈ͔ͯ͠ΈΔͱʜ ෦ॲཧ͕Ұྎવʹʂ ॲཧ࣌ؒɺ τʔΫϯɺ ίετ ֤۠ؒͷ ೖग़ྗ༰ τϨʔεͷ ۠ؒྨ
Ͳ͜ʹ͕͔͔͍࣌ؒͬͯΔ͔ಛఆͰ͖Δ ΄ͱΜͲ͕--.ͷਪ࣌ؒ
ϓϩϯϓτςϯϓϨʔτ (6*Ͱཧˍߋ৽Ͱ͖Δʂ
ςετ༻ͷσʔληοτཧͰ͖Δʂ
ΧάΧά͘Μɺແࣄʹ ՕॴΛಛఆͰ͖·ͨ͠👏 ͊ɺͯ͞ Ϣʔβʔ͞Μ͕ؒҧͬͯ σʔλফͪ͠Όͬͯͨͷ͔ʜ
ᶄ ධՁฤ
ࠓ͓٬͞·͔ΒΫϨʔϜ͕ʂ ͦͦɺ ࣭ྼԽʹͬͱ ૣ͘ؾ͚ͮͳ͍ͷʁʁ
͜ͷ िؒεϓϦϯτͰ සൟʹΞϓσ͢Δ͠ɺ ຖճཏతͳධՁ ݱ࣮తͰͳ͍ʜ
҆৺͍ͯͩ͘͠͞ɺ --.ΞϓϦઐ༻ͷ ධՁπʔϧ͕͋Γ·͢Α
ͦΕ3BHBTʂ
࣮ଶ1ZUIPOϥΠϒϥϦɻ ৭ΜͳϝτϦΫεͰճ࣭ΛԽͯ͘͠ΕΔ 'BJUIGVMOFTT ʢ৴པੑʣ 3FTQPOTF3FMFWBODZ ʢԠͷؔ࿈ੑʣ $POUFYU1SFTJDJPO ʢจ຺ਫ਼ʣ $POUFYU3FDBMM ʢจ຺ճऩʣ
-BOHGVTFʹධՁϝτϦΫε͋Γ·͕͢ɺ 3BHBTಛʹఆධ͕͋Γ·͢
ͪͳΈʹ࠷ۙɺWΞϓσ͞Ε·ͨ͠ɻ 3"(͚ͩͰͳ͘ΤʔδΣϯτʹରԠ 🎉
ͦΜͳ3BHBTͷ͍ํ؆୯ʂ ᶃ ͍͍ͨϝτϦΫε ʴධՁʹ͏"*ϞσϧΛࢦఆ ᶄ --.ΞϓϦͷೖग़ྗΛ σʔληοτʹઃఆͯ͠ɺ ධՁϝιουΛ࣮ߦʢඇಉظʣ ᶅ ࢦఆͨ͠ϝτϦΫεͷ
͕ग़ྗ͞ΕΔʂ
ͨͩɺ͜ͷ͕ίϯιʔϧ ϩάʹग़͖ͯͨͱ͜ΖͰѻ͍ʹࠔΔ😅 Ͱ͍ͬͯ͏
ͦ͏ͩɺ͖ͬ͞ͷ-BOHGVTFʹ ৯ΘͤΕ͍͍ͷͰʁ
-BOHGVTFΫϥΠΞϯτͷTDPSFϝιουͰ τϨʔεʹͿͪࠐΉ͚ͩʂ
͋ͱτϨʔεҰཡΛோΊΔ͚ͩͰɺ ࣭ྼԽͨ͠ΒҰͰߜΓࠐΊΔʂ
ΧάΧά͘Μ ʮDPOUFYU@SFDBMMʯϝτϦΫεͷมԽʹΑΓɺ ࠶ൃ࣌ʹඵͰؾ͚ͮ·ͨ͠👏 ͓ɺͳΜ͔ٸʹ ݕࡧ݁ՌΛ Θͳ͘ͳͬͨͳ 3FDBMM͕ ͍ͭ͋ΔͰ
αΫοͱࢼͤΔຊޠͷೖهࣄॻ͖·ͨ͠ʂ
࠷ޙʹએ
ɺϥεϕΨεͷ"84SF*OWFOUͰొஃ͠·͢ʂ ʮΈͷΔΜʯͰ ݕࡧ͢Δͱʜ ۭ੮͋ͱΘ͔ͣʂ ݱߦ͔ͳ͍ਓ ৴͋Δ͔ʁ