Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLMアプリをRagasで評価して、Langfuseで可視化しよう!
Search
みのるん
PRO
October 27, 2024
Technology
2k
8
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LLMアプリをRagasで評価して、Langfuseで可視化しよう!
【生成AI/LLM LT大会】今注目している技術や最新動向を共有!
https://blueish.connpass.com/event/333518/
みのるん
PRO
October 27, 2024
More Decks by みのるん
See All by みのるん
やさしいA2A入門
minorun365
PRO
10
1.5k
もりもり新機能を一挙紹介! AgentCoreに入門して、AWS上にAIエージェントを構築しよう
minorun365
PRO
6
880
Claude Codeですべての日常業務を爆速化しよう!
minorun365
PRO
17
17k
2026年春のAgentCoreアプデ 細かいやつ全部まとめ
minorun365
PRO
5
320
「責任あるAIエージェント」こそ自社で開発しよう!
minorun365
PRO
10
3.5k
2026年のAIエージェント構築はどうなる?
minorun365
PRO
23
12k
モダンUIでフルサーバーレスなAIエージェントをAmplifyとCDKでサクッとデプロイしよう
minorun365
PRO
6
510
Claude Codeベストプラクティスまとめ
minorun365
PRO
68
61k
AWSの新機能をフル活用した「re:Inventエージェント」開発秘話
minorun365
PRO
3
980
Other Decks in Technology
See All in Technology
RSA暗号を手計算したくなること、ありますよね?? (20260615_orestudy6_rsa)
thousanda
0
110
非定型業務をAI slackbotで自動化する ~ 社内要望を自動壁打ちするbotを作った ~/automating-ad-hoc-work-with-ai-slackbot
shibayu36
0
560
Rancherの紹介&Update情報(RancherJP Online Meetup #09)
yoshiyuki_kono
0
140
MCP Appsを作ってみよう
iwamot
PRO
4
370
失敗を経て、Harness Engineering で 大切にしたいことを考える / Learning from Failure: What Matters in Harness Engineering
bitkey
PRO
0
230
ルールやカスタム機能、どう活かす?ハンズオンで体感するIBM Bobの出力コントロール
muehara
1
110
"何を作るか"を任される エンジニアは、どう育つのか
yutaokafuji
1
500
2026 TECHFRESH 畢業分享會 - AI-Native 重塑軟體工程與虛擬講師
line_developers_tw
PRO
0
590
なぜ Platform Engineering の土台に Kubernetes を選ぶのか
r4ynode
1
520
NAB Show 2026 動画技術関連レポート / NAB Show 2026 Report
cyberagentdevelopers
PRO
0
150
noUncheckedIndexedAccess、3時間、1万円。 / noUncheckedIndexedAccess, 3 Hours, 10,000 JPY.
kaonavi
1
340
Claude Code の Sandbox 機能を Anthropic Sandbox Runtime(srt) で試そう!/lets-play-anthropic-sandbox-runtime
tomoki10
1
490
Featured
See All Featured
Building Flexible Design Systems
yeseniaperezcruz
330
40k
Paper Plane
katiecoart
PRO
1
51k
Reality Check: Gamification 10 Years Later
codingconduct
0
2.2k
How to make the Groovebox
asonas
2
2.2k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
Optimising Largest Contentful Paint
csswizardry
37
3.7k
How GitHub (no longer) Works
holman
316
150k
The Language of Interfaces
destraynor
162
27k
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
The SEO identity crisis: Don't let AI make you average
varn
0
490
Code Review Best Practice
trishagee
74
20k
Six Lessons from altMBA
skipperchong
29
4.3k
Transcript
ΈͷΔΜ !NJOPSVO --.ΞϓϦΛ 3BHBTͰධՁͯ͠ -BOHGVTFͰՄࢹԽ͠Α͏ʂ
XIPBNJ ޚా ູʢΈͷΔΜʣ!NJOPSVO ςοΫΤόϯδΣϦετ ,%%*ΞδϟΠϧ։ൃηϯλʔגࣜձࣾʢ,"(ʣ +"846(ӡӦ ౦ژࢧ෦ 43&ࢧ෦ /8+"84 •
"84$PNNVOJUZ)FSP • "844BNVSBJ • +BQBO"845PQ&OHJOFFS • +BQBO"84"MM$FSUT&OHJOFFS
Έͳ͞Μɺ --.ΞϓϦ࡞ͬͯ·͔͢ʁ
ͦΖͦΖɺ3"(νϟοτϘοτͷ1P$ ͖͖ͯͨํ͍ΔͷͰʜʁ
ੜ"*ΞϓϦͷ1P$Λଔۀͯ͠ ຊ൪ӡ༻ਐΉͨΊʹ ͔ܽͤͳ͍ཁૉͱ͍͑ʜ
ੜ"*ΞϓϦͷ1P$Λଔۀͯ͠ ຊ൪ӡ༻ਐΉͨΊʹ ͔ܽͤͳ͍ཁૉͱ͍͑ʜ ࢹͱධՁʂ
ᶃ ࢹฤ
ͱ͋ΔΞδϟΠϧ։ൃاۀͷ ΤϯδχΞɺΧάΧά͘Μ 3"(νϟοτϘοτΛߏங͠·ͨ͠
͋Δɺ͓٬͞·͔Β࿈བྷ͕ʜ ࠷ۙɺࣾһ͔Β ʮճ࣭͕མͪͨʯ ͱ͍͏ਃࠂ͕ ૿͍͑ͯΔΜͰ͕͢ʜ
͔֬ʹɺલਖ਼Ͱ͖͍ͯͨࣾφϨοδ2"ʹ ޡ͢ΔΑ͏ʹͳ͍ͬͯΔ ,"(ࣾͷ ެࣜΏΔΩϟϥʁ ʢώϯτɿௗྨʣ ΧάόʔυͰ͢ʢେӕʣ
͍͍ͬͨྼԽՕॴͲͩ͜Ζ͏ʜ ϓϩϯϓτ ςϯϓϨʔτ ݕࡧΫΤϦʔ ݕࡧ݁Ռ ճੜ
ϓϩϯϓτͱੜ݁Ռ͚ͩͰΘ͔Βͳ͍ʂ ,"(ࣾͷϚείοτ ΩϟϥΫλʔʁ ʢώϯτɿௗྨʣ ΧάόʔυͰ͢ʢେӕʣ ॾʑͷॲཧ
͔ͱ͍ͬͯɺຖճϩάړΔͷ͍ͩͿਏ͍ʜ
҆৺͍ͯͩ͘͠͞ɺ --.ΞϓϦઐ༻ͷ ࢹπʔϧ͕͋Γ·͢Α
༗໊ͳ--.ΞϓϦࢹπʔϧ -BOH$IBJO͕ࣾఏڙɻ 4BB4͕ͩɺ՝ۚ͢Ε ηϧϑϗετՄೳ -BOH4NJUI෩ͷػೳΛ 044ͱͯ͠ެ։ɻ खܰʹࣗڥͰಈ͔ͤΔ
ࠓճܖͳ͠ͰࢼͤΔ-BOHGVTFΛհ -BOH$IBJO͕ࣾఏڙɻ 4BB4͕ͩɺ՝ۚ͢Ε ηϧϑϗετՄೳ -BOH4NJUI෩ͷػೳΛ 044ͱͯ͠ެ։ɻ खܰʹࣗڥͰಈ͔ͤΔ
ίϯςφͱ%#͕༻ҙͰ͖Ε0,ɻ "84ͳΒ"QQ3VOOFSʴ3%4ͳͲ "84ΞΧϯτ "QQ3VOOFS 3%4 GPS1PTUHSF42- -BOHGVTF αʔόʔ σʔλϕʔε
ΞϓϦͷܭ؆୯ʂ ᶃ ڥมʹೝূΩʔͱαʔόʔ63-Λઃఆ ᶄ ࢹ͍ͨؔ͠ΛσίΔ PS-BOH$IBJOͳΒίʔϧόοΫΛ͢ Ҏ্ʂ FOW -"/('64&@4&$3&5@,&: -"/('64&@16#-*$@,&:
-"/('64&@)045
ܭޙɺ࣮ࡍʹΞϓϦΛಈ͔ͯ͠ΈΔͱʜ ෦ॲཧ͕Ұྎવʹʂ ॲཧ࣌ؒɺ τʔΫϯɺ ίετ ֤۠ؒͷ ೖग़ྗ༰ τϨʔεͷ ۠ؒྨ
Ͳ͜ʹ͕͔͔͍࣌ؒͬͯΔ͔ಛఆͰ͖Δ ΄ͱΜͲ͕--.ͷਪ࣌ؒ
ϓϩϯϓτςϯϓϨʔτ (6*Ͱཧˍߋ৽Ͱ͖Δʂ
ςετ༻ͷσʔληοτཧͰ͖Δʂ
ΧάΧά͘Μɺແࣄʹ ՕॴΛಛఆͰ͖·ͨ͠👏 ͊ɺͯ͞ Ϣʔβʔ͞Μ͕ؒҧͬͯ σʔλফͪ͠Όͬͯͨͷ͔ʜ
ᶄ ධՁฤ
ࠓ͓٬͞·͔ΒΫϨʔϜ͕ʂ ͦͦɺ ࣭ྼԽʹͬͱ ૣ͘ؾ͚ͮͳ͍ͷʁʁ
͜ͷ िؒεϓϦϯτͰ සൟʹΞϓσ͢Δ͠ɺ ຖճཏతͳධՁ ݱ࣮తͰͳ͍ʜ
҆৺͍ͯͩ͘͠͞ɺ --.ΞϓϦઐ༻ͷ ධՁπʔϧ͕͋Γ·͢Α
ͦΕ3BHBTʂ
࣮ଶ1ZUIPOϥΠϒϥϦɻ ৭ΜͳϝτϦΫεͰճ࣭ΛԽͯ͘͠ΕΔ 'BJUIGVMOFTT ʢ৴པੑʣ 3FTQPOTF3FMFWBODZ ʢԠͷؔ࿈ੑʣ $POUFYU1SFTJDJPO ʢจ຺ਫ਼ʣ $POUFYU3FDBMM ʢจ຺ճऩʣ
-BOHGVTFʹධՁϝτϦΫε͋Γ·͕͢ɺ 3BHBTಛʹఆධ͕͋Γ·͢
ͪͳΈʹ࠷ۙɺWΞϓσ͞Ε·ͨ͠ɻ 3"(͚ͩͰͳ͘ΤʔδΣϯτʹରԠ 🎉
ͦΜͳ3BHBTͷ͍ํ؆୯ʂ ᶃ ͍͍ͨϝτϦΫε ʴධՁʹ͏"*ϞσϧΛࢦఆ ᶄ --.ΞϓϦͷೖग़ྗΛ σʔληοτʹઃఆͯ͠ɺ ධՁϝιουΛ࣮ߦʢඇಉظʣ ᶅ ࢦఆͨ͠ϝτϦΫεͷ
͕ग़ྗ͞ΕΔʂ
ͨͩɺ͜ͷ͕ίϯιʔϧ ϩάʹग़͖ͯͨͱ͜ΖͰѻ͍ʹࠔΔ😅 Ͱ͍ͬͯ͏
ͦ͏ͩɺ͖ͬ͞ͷ-BOHGVTFʹ ৯ΘͤΕ͍͍ͷͰʁ
-BOHGVTFΫϥΠΞϯτͷTDPSFϝιουͰ τϨʔεʹͿͪࠐΉ͚ͩʂ
͋ͱτϨʔεҰཡΛோΊΔ͚ͩͰɺ ࣭ྼԽͨ͠ΒҰͰߜΓࠐΊΔʂ
ΧάΧά͘Μ ʮDPOUFYU@SFDBMMʯϝτϦΫεͷมԽʹΑΓɺ ࠶ൃ࣌ʹඵͰؾ͚ͮ·ͨ͠👏 ͓ɺͳΜ͔ٸʹ ݕࡧ݁ՌΛ Θͳ͘ͳͬͨͳ 3FDBMM͕ ͍ͭ͋ΔͰ
αΫοͱࢼͤΔຊޠͷೖهࣄॻ͖·ͨ͠ʂ
࠷ޙʹએ
ɺϥεϕΨεͷ"84SF*OWFOUͰొஃ͠·͢ʂ ʮΈͷΔΜʯͰ ݕࡧ͢Δͱʜ ۭ੮͋ͱΘ͔ͣʂ ݱߦ͔ͳ͍ਓ ৴͋Δ͔ʁ