Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWSでLLMアプリをつくろう / LLM App on AWS
Search
吉田真吾
July 25, 2023
Technology
0
610
AWSでLLMアプリをつくろう / LLM App on AWS
2023.7.24 JAWS-UG東京で話した資料です。
吉田真吾
July 25, 2023
Tweet
Share
More Decks by 吉田真吾
See All by 吉田真吾
AWS Lambdaと歩んだ“サーバーレス”と今後 #lambda_10years
yoshidashingo
2
340
AOAI Dev Day - Opening Session
yoshidashingo
2
1.6k
LLMアプリにエージェントらしさを組み込む/Build LLM Apps Agentically
yoshidashingo
6
1.4k
マルチエージェントで性能が上がったText-to-SQLのいま/Text-to-SQL
yoshidashingo
2
2.6k
AIエージェントをちゃんと作る/How to build agentic AI
yoshidashingo
5
1.2k
OCI Generative AI Serviceの話/20240222
yoshidashingo
0
110
ChatGPTでちゃんと成果を出していく/20240215
yoshidashingo
3
5.7k
この先を生き残るために!!「生存戦略としてのLLMアプリ開発技術」/20240124_PE-BANK
yoshidashingo
0
120
LangChainとフルサーバーレスですばやくセキュアなRAGアプリをつくるための実践解説/LangChain_Book
yoshidashingo
8
4.1k
Other Decks in Technology
See All in Technology
プロダクト開発を加速させるためのQA文化の築き方 / How to build QA culture to accelerate product development
mii3king
1
260
生成AIをより賢く エンジニアのための RAG入門 - Oracle AI Jam Session #20
kutsushitaneko
4
220
サービスでLLMを採用したばっかりに振り回され続けたこの一年のあれやこれや
segavvy
2
410
バクラクのドキュメント解析技術と実データにおける課題 / layerx-ccc-winter-2024
shimacos
2
1.1k
組織に自動テストを書く文化を根付かせる戦略(2024冬版) / Building Automated Test Culture 2024 Winter Edition
twada
PRO
13
3.7k
ブラックフライデーで購入したPixel9で、Gemini Nanoを動かしてみた
marchin1989
1
530
NilAway による静的解析で「10 億ドル」を節約する #kyotogo / Kyoto Go 56th
ytaka23
3
380
KubeCon NA 2024 Recap: How to Move from Ingress to Gateway API with Minimal Hassle
ysakotch
0
200
NW-JAWS #14 re:Invent 2024(予選落ち含)で 発表された推しアップデートについて
nagisa53
0
260
WACATE2024冬セッション資料(ユーザビリティ)
scarletplover
0
200
大幅アップデートされたRagas v0.2をキャッチアップ
os1ma
2
530
オプトインカメラ:UWB測位を応用したオプトイン型のカメラ計測
matthewlujp
0
170
Featured
See All Featured
Statistics for Hackers
jakevdp
796
220k
Building an army of robots
kneath
302
44k
VelocityConf: Rendering Performance Case Studies
addyosmani
326
24k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.9k
Mobile First: as difficult as doing things right
swwweet
222
9k
RailsConf 2023
tenderlove
29
940
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
111
49k
Site-Speed That Sticks
csswizardry
2
190
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
8
1.2k
Building Adaptive Systems
keathley
38
2.3k
Automating Front-end Workflow
addyosmani
1366
200k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
810
Transcript
"84Ͱ࣮ݱ͢Δ --.ϫʔΫϑϩʔ Ծ JAWS-UG / !ZPTIJEBTIJOHP
吉田真吾 AWS Serverless Hero n p Oracle SA p 113
/ pAWS n ( ) CTO p SaaS ( ) pAWS DevOps n pAWS (2012 ) pAWS Samurai 2014 / 2016 pAWS Serverless Hero AWS AWS Lambda Amazon S3 BRAv6
IUUQTUPLZPTFSWFSMFTTEBZTJP ˣ l(FU5JDLFUTz ˣ 𝕏 l4FSWFSMFTT%BZT 5PLZPʹࢀՃΛਃ͠ࠐΈ·ͨ͠ʂz
None
3"( ݕࡧ֦ுੜ ΞϓϦ ʮ$:%"41&01-&ʯʹɺࣾһ͔Βͷ͍߹ΘͤʹࣗಈͰ͑Δ$IBU(15ػೳʮ$:%"41&01-&$PQJMPU$IBUʯ https://www.cydas.co.jp/news/press/202304_people-gpt/
None
ੈେ--.࣌ "*ͷຽओԽ ΞϓϦ։ൃऀ͕--.ΞϓϦΛϢʔβʔʹಧ͚͍࣌͢ ͬͱখ͍͠Μ͔ͱࢥͬͯͨΑ
λεΫ ❌ ˠ ۀ ⭕ ϫʔΫϑϩʔ ෳͷλεΫΛϓϩάϥϛϯάʹΑΔ੍ޚͱɺ--.ʹΑΔ੍ޚΛͭͳ͍Ͱ ࣮ݱ͢Δ
ֶΜͩ͜ͱ 3"(࣮͍͢͠ˠ<69؍>ैདྷͷݕࡧ6* --.Tͳ͠ ͰղܾͰ͖Δʁ ຒΊࠐΈදݱ &NCFEEJOHT औಘͯ͠ϕΫλʔྨࣅݕࡧ͢ΔΑΓɺΤϯλʔϓ ϥΠζݕࡧͷ΄͏͕͍͍ͨͯɺͯ͢ʹ͓͍ͯྑ͍
--.ͷೳྗΛ׆͔͢ϫʔΫϑϩʔ͕ॏཁ ग़ྗ͕֬ఆతͳϓϩάϥϛϯάͱɺඇ֬ఆతͳ--.ͷΈ߹Θͤ ෳͷλεΫΛνΣΠϯ͍ͯ͘͠🦜🔗 🦜🔗ΞΠσΞʴ࣮ͷๅݿ 3F"DU ˠ MBOHDIBJOBHFOUT )Z%& ˠ ࣭ͷ͑Λ--.͕ໝͯ͠ɺͦͷ͑ʹྨࣅͨࣝ͠ΛݕࡧGSPN MBOHDIBJODIBJOT JNQPSU)ZQPUIFUJDBM%PDVNFOU&NCFEEFS --.0QT㱠.-0QT ೖྗͷมԽ ग़ྗͷมԽʹؾ͖ͮͮΒ͍ ؾ͍ͮͨͱͯͰ͖Δ͜ͱ͕ݶΒΕΔ "1*Ϟσϧͷࠩ͠ସ͑ɺϓϩϯϓτͷௐ ʴ όʔδϣϯཧ ϨεϙϯελΠϜͳͲऔಘ͓͖ͯͩ͘͠Ζ͏ FY -BOH4NJUI
"NB[PO,FOESB 🦜🔗 ⾼精度な⽣成系 AI アプリケーションを Amazon Kendra、LangChain、⼤規模⾔語モデルを使って作る https://aws.amazon.com/jp/blogs/news/quickly-build-high-accuracy-generative-ai-applications-on-enterprise- data-using-amazon-kendra-langchain-and-large-language-models/
🦜🔗 ֶͿͳΒ 6EFNZ -BOH$IBJOʹΑΔେنݴޠϞσϧʢ--.ʣΞϓϦ έʔγϣϯ։ൃೖʕ(15ΛͬͨνϟοτϘοτͷ࣮·Ͱ https://www.udemy.com/course/langchain-apps/
🦜🔗 ֶͿͳΒ ͘͘-BOH$IBJO https://langchain-jp.connpass.com/event/289590/
ηΩϡϦςΟͱϓϥΠόγʔ ຊ൪ڥར༻ʹ͚ͯ
"84ͷΫϥυηΩϡϦςΟσʔλอޢ • ࣄ࣮ • "84ηΩϡϦςΟʹലେͳࢿɿෳͷαʔϏεɺෳͷίϯϓϥ ΠΞϯε४ڌ • ΫϥυΛΫϥυͨΒ͠ΊͯΔͷ "*ʹΑΔίϯτϩʔϧ •
༧ଌ • <>ηΩϡϦςΟ৫ͷ͋ΒΏΔ׆ಈʹෆՄܽʹͳΔ • <>"*ػցֶशͰଅਐ͞ΕͨΦʔτϝʔγϣϯ͕ηΩϡϦςΟΛڧ Խ͢Δ • "NB[PO(VBSE%VUZɺ"NB[PO%FUFDUJWFɺ"NB[PO$PEF(VSVɺ"NB[PO .BDJFʜ • <>σʔλอޢͷΑΓେ͖ͳࢿ͕ਐΉ • (%13ಉ༷ͷن੍ͷੈք֤ࠃͷ͕Γɾ࣮ӡ༻ͷڧԽ CJ Moses による 2023 年以降の セキュリティに 関する予測 https://d1.awsstatic.com/Security/Security_Predictions_e-book_2022_JP .pdf
08"415PQ--.ΞϓϦ<ESBGU> ϓϩϯϓτΠϯδΣΫγϣϯ • --.͕ҙਤ͠ͳ͍ಈ࡞ΛҾ͖ى͜͢ϓϩϯϓτͷ ্ॻ͖ ҆શͰͳ͍ग़ྗॲཧ • όοΫΤϯυγεςϜͷใ͕ग़ྗ͞ΕΔ͜ͱʹ
ΑΔѱ༻ τϨʔχϯάσʔλͷԚછ • ηΩϡϦςΟɺ༗ޮੑɺྙཧత;Δ·͍ͷӨڹ Ϟσϧͷ%P4 • େྔͷτʔΫϯফඅɺϨεϙϯεѱԽɺίετߴ ಅ αϓϥΠνΣʔϯͷ੬ऑੑ • ϓϥάΠϯSEύʔςΟͷίϯϙʔωϯτ͔Β ͷ৵ ػີσʔλͷ࿙Ӯ • ԠͰػີσʔλΛ࿙Ӯ͢ΔՄೳੑˠෆਖ਼ΞΫηεɺ ϓϥΠόγʔ৵ɺηΩϡϦςΟ৵ ҆શͰͳ͍ϓϥάΠϯઃܭ ˞ͱྨࣅ • ϓϥάΠϯ͔Β҆શͰͳ͍ೖྗʹΑΓ੬ऑੑ͕ѱ༻ ͞ΕΔ ΤʔδΣϯτͷ • ࣗతͳΤʔδΣϯτ͕ҙਤ͠ͳ͍݁ՌΛͨΒ͢ ΞΫγϣϯΛ࣮ߦ͢ΔՄೳੑ աͳґଘ • ෆਖ਼֬ɾෆదͳੜίϯςϯπʹґଘͯ͠σϚɺ ๏తɺηΩϡϦςΟ੬ऑੑʹ໘͢Δ Ϟσϧట • ಠࣗϞσϧͷෆਖ਼ΞΫηεɺྲྀग़ˠܦࡁଛࣦɺڝ ૪༏ҐੑԼ ˞ৠཹϑΝΠϯνϡʔχϯάάϨʔ͔ OWASP Top 10 for Large Language Model Applications https://owasp.org/www-project-top-10-for-large-language-model-applications/
ݸਓσʔλอޢ๏੍ɿνΣοΫ͖͢ • ԿΛอޢ͢Δͷ͔ˠʮݸਓͷݖརརӹʯ • ݸਓσʔλอޢͷʮܾఆࢦʯརӹϞσϧ • ࣗݾใίϯτϩʔϧݖͰͳ͘ɺใతଞ͔Βͷࣗ༝ • ΘΕΘΕʹԿ͕ٻΊΒΕ͏Δͷ͔ •
ࣗݾใίϯτϩʔϧݖࡒ࢈ݖతϞσϧͷຊਓಉҙݪଇ ΦϓτΠϯΦϓτΞτ ˠͳʹ͕ ݸਓใͰͳʹ͕ݸਓใͰͳ͍ͱ͍͏ٞʹͳΔ • ใతଞݸਓσʔλॲཧʹجͮ͘ଞऀʹΑΔධՁɾܾఆ͕ຊਓͷࣗݾܾఆΛ્͠͏Δ͜ ͱˠ͔Βͷࣗ༝ ޚͰ͖Δ͜ͱ • ͨͱ͑ • ݹ͍ଐੑใɺ͍͋·͍ͳଐੑใͰ৬ͰͷධՁ͕ܾΊΒΕͨ ˞ͦͦ0&$%ݪଇ σʔλ࣭ͷݪଇ ʹ͍ͯ͠Δ͕ɻ • ؔ࿈ੑͷͳ͍ใͰෆརͳΫϨδοτείΞ͕ܾఆ͞Εͨ ˠ ͜ΕΒΛγεςϜͰϞχλϦϯά͢Δෆஅͷྗ͕ٻΊΒΕ͏Δ • ཧతجૅ͔Β๏ମܥͷཧ • ౷੍͞Εͨඇબผར༻ˠҩྍԾ໊Ճใɿ౷ܭྔʹूܭͨ͠σʔλɺ·ͨೋ࣍ར༻ • ݸਓσʔλॲཧத৺ͷنˠॲཧରͱ͠ͳ͍σʔλͷϚεΩϯάɺΦϓτΠϯॲཧͷෛ୲ • ධՁɾܾఆͷదੑ֬อˠબผΞϧΰϦζϜ దੑͰબผͨ͠ڭҭϓϩάϥϜɺ0,ʁ 【提⾔書公表】デジタル社会を駆動する『個⼈データ保護法制』に向けて(GLOCOM六本⽊会議) https://www.glocom.ac.jp/news/news/8540
🦜🔗 &YQFSJNFOUBMύοέʔδׂ • Ϗοάχϡʔε • $7& ੬ऑੑ ΛؚΉػೳΛͯ͢ผύοέʔδ &YQFSJNFOUBM ʹ
• 🦜🔗ίΞͷεϦϜԽ • $PNNVOJUZνΣΠϯͱ͍͏ύοέʔδͷܭըʹݴٴ • ҙຯ͢Δ͜ͱ • ຊ൪Ͱ͑ͳ͍ ˠ ͍͏Δ • ͜ͷऑɺແ੍ݶʹ֦ு͞ΕΔҰํͩͬͨͷͰ-BNCEB-BZFSʹ͍ ͔ͭΒͳ͘ͳΔ ˠ Ұఆͷަ௨ཧ͕͞ΕΔΑ͏ʹͳΔ • จͷ࣮৺తͳΞΠσΞͷ࣮͕ΑΓ13ग़͘͢͠ͳΔ • "84-BNCEBͰͷར༻ • ݱࡏͷαΠζɿґଘϥΠϒϥϦؚΊͨల։ޙαΠζͰ.#ఔ • εϐϯΞοϓʹ͓͓ΉͶඵఔ͔͔Δˠ4MBDL͔Β͏߹ -B[ZϦεφʔϦτϥΠϔομͷνΣοΫͳͲෳͷରࡦ͕ඞཁ
IUUQTUPLZPTFSWFSMFTTEBZTJP ˣ l(FU5JDLFUTz ˣ 𝕏 l4FSWFSMFTT%BZT 5PLZPʹࢀՃΛਃ͠ࠐΈ·ͨ͠ʂz
%":4্࢙࠷ߴͷϥΠϯφοϓ • ߽՚ηογϣϯ • Ωʔϊʔτɿ"84 • αʔόʔϨεͷख़ •
αʔόʔαΠυओମ͔ΒΤοδϑϩϯτͷ։ൃϥΠϑαΠΫϧ ͷมԽ • ੜ"*ͱαʔόʔϨε • ߽՚εϙϯαʔ • "84 • .PNFOUP • 1JOH$"1 5J%# • .JDSPTPGU • ,%%*ΞδϟΠϧ։ൃηϯλʔ • 4FSWFSMFTT0QFSBUJPOT