Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWS Neuron Community - Day One
Search
Yoshitaka Haribara
April 09, 2025
Technology
160
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
AWS Neuron Community - Day One
Yoshitaka Haribara
April 09, 2025
More Decks by Yoshitaka Haribara
See All by Yoshitaka Haribara
クラウド・AI 時代の研究開発 DX / R&D Digital Transformation
hariby
0
53
Physical AI on AWS: 小規模実験からマルチノード学習・推論へのスケーリングパス / Robot FM Training & Inference
hariby
0
63
AWS re:Invent 2025 Recap for JAWS-UG AI ML
hariby
0
100
日本の AI 開発と世界の潮流 / GenAI Development in Japan
hariby
2
1.4k
AI Agent Day 2025 - AI Table
hariby
0
48
AI エージェントとはそもそも何か? - 技術背景から Amazon Bedrock AgentCore での実装まで- / AI Agent Unicorn Day 2025
hariby
6
2.6k
AWS Unicorn Day Keynote - GenAI part
hariby
0
59
Growing with GenAI Startups in Japan
hariby
0
46
Generative AI FM Training and Deployment with NVIDIA NeMo and NIM on Amazon SageMaker
hariby
0
150
Other Decks in Technology
See All in Technology
2026TECHFRESH畢業分享會 - Lightning Talk - 資料也要 CI/CD? 用 Airbyte 自動化資料同步
line_developers_tw
PRO
0
1k
AGENTS.mdとSkillsで始めるAIエージェント活用
sonoda_mj
3
210
Android の公式 Skill / Android skills
yanzm
0
140
マルチアカウント環境での コーディングエージェントを使った障害調査が大変なので AIエージェントにReadOnly権限を付与してみた / ReadOnly AI Agents for Multi-Account AWS Incident Response
yamaguchitk333
2
100
小さくはじめるSLI/SLO ~育てながら組織に定着させる実践知~ / Starting Small with SLI/SLOs: Building Adoption Through Continuous Growth
nari_ex
7
1.9k
機械学習を「社会実装」するということ 2026年夏版 / Social Implementation of Machine Learning June 2026 Version
moepy_stats
5
2.4k
【Snowflake Summit 2026 Recap!!】Snowflake Summit Deep Dive: Security & Governance
civitaspo
1
170
「エンジニア進化論」2028年の開発完全自動化、エンジニアはどう進化するか
cyberagentdevelopers
PRO
6
5.1k
2026TECHFRESH畢業分享會 - AI 時代的人生存檔點
line_developers_tw
PRO
0
1k
脆弱性対応、どこで線を引くか
rymiyamoto
1
390
社内 AI エージェント Synapse と セマンティックレイヤーの育て方
hiroakis
3
1.9k
20260619 私の日常業務での生成 AI 活用
masaruogura
1
200
Featured
See All Featured
Six Lessons from altMBA
skipperchong
29
4.3k
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.3k
Documentation Writing (for coders)
carmenintech
77
5.4k
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
200
Reality Check: Gamification 10 Years Later
codingconduct
0
2.2k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9.1k
A better future with KSS
kneath
240
18k
Fireside Chat
paigeccino
42
3.9k
GraphQLとの向き合い方2022年版
quramy
50
15k
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
2k
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
230
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
230
Transcript
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 針原 佳貴 Sr. Startup GenAI/Quantum Solutions Achitect Amazon Web Services Japan Neuron Community - Day One
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 2 本⽇のきっかけは… 2025年1⽉14⽇ に開催した「基盤モデル開発者向け Deep Dive セッション」 にご登壇頂いたカラクリ社 中⼭様より https://aws.amazon.com/jp/blogs/news/model-developer-deep-dive- trainium2-bedrock-marketplace/
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. AWS LLM 開発⽀援プログラム (2023-2024) • ⽇本の企業・団体が独⾃の基盤モデル (FM)・ ⼤規模⾔語モデル (LLM) を構築するための独⾃プログラム • 15採択者のうち12事業者が FM/LLM 学習に EC2 Trn1 (AWS Trainium) インスタンスを選択 10事業者は Llama 2 ベースの (継続) 事前学習 • 「モデルのアーキテクチャは ⽇進⽉歩で新しいものが出ていますが、 学習戦略やデータは企業の開発技術として注⼒すべき」 — リコー 鈴⽊ 剛 ⽒ • 「産業界では、ChatGPT よりもさらにハルシネーション が抑⽌された信頼性の⾼い LLM が求められている」 — ストックマーク 有⾺ 幸介 ⽒ 3 Japanese: https://aws.amazon.com/jp/blogs/news/llm-development-support-program-generative-ai-program-results/ English: https://aws.amazon.com/blogs/machine-learning/unlocking-japanese-llms-with-aws-trainium- innovators-showcase-from-the-aws-llm-development-support-program/
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 経済産業省 GENIAC 第2期 (2024-2025) • AWS は計算リソース提供事業者として GENIAC ⽀援チームを⽴ち上げ⽀援: • 計算資源: Amazon EC2 P5, Trn1 インスタンスの提供 • 技術⽀援: AWS Solutions Architect (SA) 中⼼に分散学習クラスタ構築⽀援 • 開発者コミュニティ: 海外機械学習エンジニアとの交流 (最先端の開発動向)、 国内機械学習エンジニア同⼠の交流 (知⾒共有) など • 事業化⽀援: GENIAC で開発された基盤モデル・⽣成 AI アプリケーションの go-to-market や Amazon Bedrock Marketplace 掲載⽀援など • 「AWSからは技術・ビジネスの両⾯でご⽀援いただき⼤変感謝しております。 AWS Trainium は効率的に LLM 開発を進めることができる最適な選択肢だと思っ ております」 — カラクリ 中⼭ 智⽂ ⽒ https://aws.amazon.com/jp/blogs/news/geniac-cycle2-kick-off/ 4
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. Amazon EC2 Inf2 (AWS Inferentia2) • ELYZA: EC2 Inf2 (AWS Inferentia2) インスタンスを利⽤し、Speculative Decoding で⾼速化した ELYZA LLM for JP (Llama 2 ベース) の推論環境構築 「AWS Inferentia2 は、⾼いスループットと低いレイテンシーを実現しています し、このアクセラレーターを搭載したインスタンスはキャパシティの観点で簡単 に調達できます。⽐較的安価なコストで、かつ⼤量にサーバーを準備できるとい うのは、デモサービスを構築するうえで重要な要素でした」 — 堀江 伸太朗 ⽒ https://aws.amazon.com/jp/blogs/startup/tech-interview-elyza-2024/ • Spiral AI: ⽂章⽣成処理については、AWS Inferentia2 を搭載した Amazon EC2 Inf2 インスタンスを使⽤しています。このインスタンスは⽣成 AI モデル向けに、 推論コストを抑えつつ⾼いパフォーマンスを実現してくれます。⾳声合成の部分 は、コストを下げつつ⾼速に応答することを⽬指して、コストパフォーマンスに 優れた Amazon EC2 G5g インスタンスを活⽤しています。 —安⽴ 健⼈ ⽒ https://aws.amazon.com/jp/blogs/startup/tech-interview-spiralai-2024/ 5
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. 7 コミュニティの意義 • ⽇本からは AWS Trainium/Inferentia の先進的な事例が出ており、 その知⾒が各社に溜まっている • これは、Annapurna Labs 含む AWS グローバルチームからも⼗分認識されている • しかし、企業間の情報交換やコラボレーションが⼗分に進んでいるとはいえない • そこで、Neuron Community において、実際の活⽤における知⾒を共有し、 エンジニア同⼠による会社を越えたコラボレーションが期待される
© 2025, Amazon Web Services, Inc. or its affiliates. All
rights reserved. Thank you! © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved.