Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLMアプリをRagasで評価して、Langfuseで可視化しよう!
Search
みのるん
PRO
October 27, 2024
Technology
7
1.1k
LLMアプリをRagasで評価して、Langfuseで可視化しよう!
【生成AI/LLM LT大会】今注目している技術や最新動向を共有!
https://blueish.connpass.com/event/333518/
みのるん
PRO
October 27, 2024
Tweet
Share
More Decks by みのるん
See All by みのるん
マネコン操作いらず! TerraformでAWSインフラのコーディングに入門しよう
minorun365
PRO
5
1.7k
Qiita Organizationを導入したら、アウトプッターが爆増して会社がちょっと有名になった件
minorun365
PRO
1
440
AI自体のOps 〜LLMアプリの運用、AWSサービスとOSSの使い分け〜
minorun365
PRO
11
1.6k
AIエージェント入門
minorun365
PRO
40
22k
まだ間に合う! エンジニアのための生成AIアプリ開発入門 on AWS
minorun365
PRO
6
850
AWSの生成AIサービス Amazon Bedrock入門!(2025年1月版)
minorun365
PRO
9
1k
Oracle Cloudの生成AIサービスって実際どこまで使えるの? エンジニア目線で試してみた
minorun365
PRO
7
460
密着! Bedrockerがre:Invent 2024で過ごした5日間を紹介
minorun365
PRO
5
650
re:Inventで発表された Bedrockの新機能を色々使って、マルチRAGエージェントにクラウド選定させてみた件
minorun365
PRO
4
600
Other Decks in Technology
See All in Technology
OCI見積もり入門セミナー
oracle4engineer
PRO
0
110
頻繁リリース × 高品質 = 無理ゲー? いや、できます!/20250306 Shoki Hyo
shift_evolve
0
150
Amazon EKS Auto ModeでKubernetesの運用をシンプルにする
sshota0809
0
110
バクラクでのSystem Risk Records導入による変化と改善の取り組み/Changes and Improvement Initiatives Resulting from the Implementation of System Risk Records
taddy_919
0
220
AWS のポリシー言語 Cedar を活用した高速かつスケーラブルな認可技術の探求 #phperkaigi / PHPerKaigi 2025
ytaka23
7
1.5k
LINE Notify互換のボットを作った話
kenichirokimura
0
170
Javaの新しめの機能を知ったかぶれるようになる話 #kanjava
irof
3
4.9k
Compose MultiplatformにおけるiOSネイティブ実装のベストプラクティス
enomotok
1
210
20250326_管理ツールの権限管理で改善したこと
sasata299
1
350
DevinはクラウドエンジニアAIになれるのか!? 実践的なガードレール設計/devin-can-become-a-cloud-engineer-ai-practical-guardrail-design
tomoki10
3
1.3k
数百台のオンプレミスのサーバーをEKSに移行した話
yukiteraoka
0
640
ペアプログラミングにQAが加わった!職能を超えたモブプログラミングの事例と学び
tonionagauzzi
1
140
Featured
See All Featured
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
31
4.7k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
4
470
Embracing the Ebb and Flow
colly
85
4.6k
VelocityConf: Rendering Performance Case Studies
addyosmani
328
24k
Designing for humans not robots
tammielis
250
25k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
7
610
Optimizing for Happiness
mojombo
377
70k
Visualization
eitanlees
146
15k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Git: the NoSQL Database
bkeepers
PRO
429
65k
Making the Leap to Tech Lead
cromwellryan
133
9.2k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
30k
Transcript
ΈͷΔΜ !NJOPSVO --.ΞϓϦΛ 3BHBTͰධՁͯ͠ -BOHGVTFͰՄࢹԽ͠Α͏ʂ
XIPBNJ ޚా ູʢΈͷΔΜʣ!NJOPSVO ςοΫΤόϯδΣϦετ ,%%*ΞδϟΠϧ։ൃηϯλʔגࣜձࣾʢ,"(ʣ +"846(ӡӦ ౦ژࢧ෦ 43&ࢧ෦ /8+"84 •
"84$PNNVOJUZ)FSP • "844BNVSBJ • +BQBO"845PQ&OHJOFFS • +BQBO"84"MM$FSUT&OHJOFFS
Έͳ͞Μɺ --.ΞϓϦ࡞ͬͯ·͔͢ʁ
ͦΖͦΖɺ3"(νϟοτϘοτͷ1P$ ͖͖ͯͨํ͍ΔͷͰʜʁ
ੜ"*ΞϓϦͷ1P$Λଔۀͯ͠ ຊ൪ӡ༻ਐΉͨΊʹ ͔ܽͤͳ͍ཁૉͱ͍͑ʜ
ੜ"*ΞϓϦͷ1P$Λଔۀͯ͠ ຊ൪ӡ༻ਐΉͨΊʹ ͔ܽͤͳ͍ཁૉͱ͍͑ʜ ࢹͱධՁʂ
ᶃ ࢹฤ
ͱ͋ΔΞδϟΠϧ։ൃاۀͷ ΤϯδχΞɺΧάΧά͘Μ 3"(νϟοτϘοτΛߏங͠·ͨ͠
͋Δɺ͓٬͞·͔Β࿈བྷ͕ʜ ࠷ۙɺࣾһ͔Β ʮճ࣭͕མͪͨʯ ͱ͍͏ਃࠂ͕ ૿͍͑ͯΔΜͰ͕͢ʜ
͔֬ʹɺલਖ਼Ͱ͖͍ͯͨࣾφϨοδ2"ʹ ޡ͢ΔΑ͏ʹͳ͍ͬͯΔ ,"(ࣾͷ ެࣜΏΔΩϟϥʁ ʢώϯτɿௗྨʣ ΧάόʔυͰ͢ʢେӕʣ
͍͍ͬͨྼԽՕॴͲͩ͜Ζ͏ʜ ϓϩϯϓτ ςϯϓϨʔτ ݕࡧΫΤϦʔ ݕࡧ݁Ռ ճੜ
ϓϩϯϓτͱੜ݁Ռ͚ͩͰΘ͔Βͳ͍ʂ ,"(ࣾͷϚείοτ ΩϟϥΫλʔʁ ʢώϯτɿௗྨʣ ΧάόʔυͰ͢ʢେӕʣ ॾʑͷॲཧ
͔ͱ͍ͬͯɺຖճϩάړΔͷ͍ͩͿਏ͍ʜ
҆৺͍ͯͩ͘͠͞ɺ --.ΞϓϦઐ༻ͷ ࢹπʔϧ͕͋Γ·͢Α
༗໊ͳ--.ΞϓϦࢹπʔϧ -BOH$IBJO͕ࣾఏڙɻ 4BB4͕ͩɺ՝ۚ͢Ε ηϧϑϗετՄೳ -BOH4NJUI෩ͷػೳΛ 044ͱͯ͠ެ։ɻ खܰʹࣗڥͰಈ͔ͤΔ
ࠓճܖͳ͠ͰࢼͤΔ-BOHGVTFΛհ -BOH$IBJO͕ࣾఏڙɻ 4BB4͕ͩɺ՝ۚ͢Ε ηϧϑϗετՄೳ -BOH4NJUI෩ͷػೳΛ 044ͱͯ͠ެ։ɻ खܰʹࣗڥͰಈ͔ͤΔ
ίϯςφͱ%#͕༻ҙͰ͖Ε0,ɻ "84ͳΒ"QQ3VOOFSʴ3%4ͳͲ "84ΞΧϯτ "QQ3VOOFS 3%4 GPS1PTUHSF42- -BOHGVTF αʔόʔ σʔλϕʔε
ΞϓϦͷܭ؆୯ʂ ᶃ ڥมʹೝূΩʔͱαʔόʔ63-Λઃఆ ᶄ ࢹ͍ͨؔ͠ΛσίΔ PS-BOH$IBJOͳΒίʔϧόοΫΛ͢ Ҏ্ʂ FOW -"/('64&@4&$3&5@,&: -"/('64&@16#-*$@,&:
-"/('64&@)045
ܭޙɺ࣮ࡍʹΞϓϦΛಈ͔ͯ͠ΈΔͱʜ ෦ॲཧ͕Ұྎવʹʂ ॲཧ࣌ؒɺ τʔΫϯɺ ίετ ֤۠ؒͷ ೖग़ྗ༰ τϨʔεͷ ۠ؒྨ
Ͳ͜ʹ͕͔͔͍࣌ؒͬͯΔ͔ಛఆͰ͖Δ ΄ͱΜͲ͕--.ͷਪ࣌ؒ
ϓϩϯϓτςϯϓϨʔτ (6*Ͱཧˍߋ৽Ͱ͖Δʂ
ςετ༻ͷσʔληοτཧͰ͖Δʂ
ΧάΧά͘Μɺແࣄʹ ՕॴΛಛఆͰ͖·ͨ͠👏 ͊ɺͯ͞ Ϣʔβʔ͞Μ͕ؒҧͬͯ σʔλফͪ͠Όͬͯͨͷ͔ʜ
ᶄ ධՁฤ
ࠓ͓٬͞·͔ΒΫϨʔϜ͕ʂ ͦͦɺ ࣭ྼԽʹͬͱ ૣ͘ؾ͚ͮͳ͍ͷʁʁ
͜ͷ िؒεϓϦϯτͰ සൟʹΞϓσ͢Δ͠ɺ ຖճཏతͳධՁ ݱ࣮తͰͳ͍ʜ
҆৺͍ͯͩ͘͠͞ɺ --.ΞϓϦઐ༻ͷ ධՁπʔϧ͕͋Γ·͢Α
ͦΕ3BHBTʂ
࣮ଶ1ZUIPOϥΠϒϥϦɻ ৭ΜͳϝτϦΫεͰճ࣭ΛԽͯ͘͠ΕΔ 'BJUIGVMOFTT ʢ৴པੑʣ 3FTQPOTF3FMFWBODZ ʢԠͷؔ࿈ੑʣ $POUFYU1SFTJDJPO ʢจ຺ਫ਼ʣ $POUFYU3FDBMM ʢจ຺ճऩʣ
-BOHGVTFʹධՁϝτϦΫε͋Γ·͕͢ɺ 3BHBTಛʹఆධ͕͋Γ·͢
ͪͳΈʹ࠷ۙɺWΞϓσ͞Ε·ͨ͠ɻ 3"(͚ͩͰͳ͘ΤʔδΣϯτʹରԠ 🎉
ͦΜͳ3BHBTͷ͍ํ؆୯ʂ ᶃ ͍͍ͨϝτϦΫε ʴධՁʹ͏"*ϞσϧΛࢦఆ ᶄ --.ΞϓϦͷೖग़ྗΛ σʔληοτʹઃఆͯ͠ɺ ධՁϝιουΛ࣮ߦʢඇಉظʣ ᶅ ࢦఆͨ͠ϝτϦΫεͷ
͕ग़ྗ͞ΕΔʂ
ͨͩɺ͜ͷ͕ίϯιʔϧ ϩάʹग़͖ͯͨͱ͜ΖͰѻ͍ʹࠔΔ😅 Ͱ͍ͬͯ͏
ͦ͏ͩɺ͖ͬ͞ͷ-BOHGVTFʹ ৯ΘͤΕ͍͍ͷͰʁ
-BOHGVTFΫϥΠΞϯτͷTDPSFϝιουͰ τϨʔεʹͿͪࠐΉ͚ͩʂ
͋ͱτϨʔεҰཡΛோΊΔ͚ͩͰɺ ࣭ྼԽͨ͠ΒҰͰߜΓࠐΊΔʂ
ΧάΧά͘Μ ʮDPOUFYU@SFDBMMʯϝτϦΫεͷมԽʹΑΓɺ ࠶ൃ࣌ʹඵͰؾ͚ͮ·ͨ͠👏 ͓ɺͳΜ͔ٸʹ ݕࡧ݁ՌΛ Θͳ͘ͳͬͨͳ 3FDBMM͕ ͍ͭ͋ΔͰ
αΫοͱࢼͤΔຊޠͷೖهࣄॻ͖·ͨ͠ʂ
࠷ޙʹએ
ɺϥεϕΨεͷ"84SF*OWFOUͰొஃ͠·͢ʂ ʮΈͷΔΜʯͰ ݕࡧ͢Δͱʜ ۭ੮͋ͱΘ͔ͣʂ ݱߦ͔ͳ͍ਓ ৴͋Δ͔ʁ