Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
re:Infrastructure_for the NextGen AI/ML and Beyond
Search
ICHICHI
December 17, 2024
Business
710
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
re:Infrastructure_for the NextGen AI/ML and Beyond
ICHICHI
December 17, 2024
More Decks by ICHICHI
See All by ICHICHI
AP-21_Kyndryl_AWS-Summit-JP-2025
ichichi
0
27
re:Connect_NW&SecurityでAWSとの接続を再考する
ichichi
0
140
Hybrid NW Infra Design Review: Classic Pattern including Outposts & Route 53 Profile
ichichi
2
820
PetiteSRE_GenAIEraにおけるインフラのあり方観察
ichichi
0
440
Other Decks in Business
See All in Business
Sotas Company Deck / 会社紹介資料
sotas
0
430
Corporate Story (GA technologies Co., Ltd.)
gatechnologies
0
920
メンバーズ会社紹介資料/Members company brochure
members_recruiting
0
37k
【簡易版】パーソルクロステクノロジー_システムインテグレーション領域のご紹介 / Introduction_of_persol-xtech_gs_es_dx_short
pxt_gs_ssol
0
160k
ログラス会社紹介資料 / Loglass Company Deck
loglass2019
17
550k
コミュニケーション術を強化するのにオススメな本9冊
zashii
0
450
株式会社うるる エンジニア向け採用資料
uluru_hr
3
130k
ROOT Thesis Q1 2026
a1256382
0
180
PIVOT:BPエントランスブック
sotaro04
0
180
SimpleForm 会社紹介資料
simpleform
2
54k
【結果報告】Claude×Linearで会社のタスク管理をAIにまかせて1ヶ月。業務効率150%向上したが、AIネイティブカンパニーを目指すならもっと「加速への狂気」が必要
nagatsu
0
410
JAWSDAYSに参加した思いを叫びたい!
yuidyy
1
120
Featured
See All Featured
My Coaching Mixtape
mlcsv
0
140
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
201
75k
GraphQLとの向き合い方2022年版
quramy
50
15k
Exploring anti-patterns in Rails
aemeredith
3
400
The Limits of Empathy - UXLibs8
cassininazir
1
350
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
The Cult of Friendly URLs
andyhume
79
6.9k
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.3k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
580
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
2
1.5k
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
400
How to train your dragon (web standard)
notwaldorf
97
6.7k
Transcript
: キンドリルジャパン株式会社 叶 奕池( )
自己紹介 叶 奕池(ICHICHI) キンドリルジャパン株式会社 Infrastructure/Cloud Architect Japan AWS Junior.Champion 2023
略歴: 2024年6月ー現在 大手カード会社様 生成AI基盤開発案件 Lead Architect, Tech Lead • GPU-Basedコンテナ基盤、AI/MLデータベース、自動化設計・開発 • Full Stackスクラム開発支援 2024年6月ー現在 大手自動車産業のお客様 DX基盤開発案件 Associate Architect • Over 2000+サーバを有する大規模AWS基盤設計・構築 • スクラム開発推進 2022年4月ー2024年6月 大手保険会社様 アウトソーシング案件 AWS Team Lead, Architect • Over 1000+サーバーを有する大規模ハイブリッドクラウド基盤構築・運用管理自動化設計 • 先端ソリューション開発:Outposts、オンプレミスへのAWSエージェント統合、など • 日米協同クラウド活用推進 2021年4月ー2022年3月 IBM Cloud Advanced Customer Support セキュリティサポートエンジニア 2021年4月 新卒入社 よう えきち
1. クラウドインフラ : スタック、ビルディングブロック、そしてプロセス 2. AWSからのメッセージと現実にあるボトルネック • •
1. クラウドインフラ : スタック、ビルディングブロック、そしてプロセス ❶アプリケーション ❷データ ❸ランタイムまたはアプリを実行する ❹アプリをモニタリングする または ❺アプリが実行される
❻仮想化テクノロジー ➐サーバーマシン ❽ストレージデバイス ❾ネットワークアプライアンス アプリ 開発ツール ❶アプリケーション統合 ❷データベース & 分析 ❸システム管理 & ガバナンス ❹モニタリング & ロギング ❺セキュリティ, 認証認可, コンプライアンス ❻ストレージ ➐ネットワーク ❽コンピューティング 構築 運用 出典: 1. IaaS とは - Infrastructure as a Service の説明 – AWS 2. Gartner Generative AI Predictions for 2024-2028
2. AWSからのメッセージと現実にあるボトルネック 出典: 1. AWS Monday Night Live 2024: Innovations
in Compute, Security, and AI Infrastructure – AWS 2. AWS-Announces-New-Data-Center-Components-to-Support-AI-Innovation-and-Further-Improve-Energy-Efficiency - US Press Center ❶ • ベンダーロックイン対策としてのAWSサー ビスとOSSの組み合わせは、バージョン管 理の複雑さを増加 ❷ AI/MLアプリの開発速度と需要に対応可能 なインフラの効果的な実装には技術ツール の活用を超えた取り組みが必要 ❸ • 現在のクラウドAI/MLインフラは、AIワー クロード向けに適応された従来のクラウド サービス設計に依存しており、AI専用には まだシフトしていない
• 各コンポーネントが相互に連携し、全体とし て機能する動的で統合されたネットワーク • このエコシステム型アプローチでは、個々の 要素だけでなく、それらの相互作用や全体の 進化を重視 • これにより、AIソリューションの開発、導入、 運用、そして継続的な進化を、持続可能で効
率的な環境でサポート 「SOFT」Infrastructure Re: Infrastructure 「HARD」Infrastructure • コンピュート、ストレージ、ネットワーク、クラウド 施設といった物理的・従来型のコンポーネントを指す • データ処理・分析機能、モデルの展開や学習フレーム ワーク、AIワークロード向けに特化した運用ツールと いった機能的な側面を指す ( )
「 」 「 」 ( ) ❶ • 16基のTrainium2でピーク時最大20.8PFLOPSの計算能⼒を提供 •
64 基 の Trainium を NeuronLink で 接 続 し た Amazon EC2 Trn2UltraServersのプレビュー開始 • Trn2単体の4倍となるピーク時最大83.2PFLOPSを提供し最大規 模のモデル学習やデプロイに適する ❷ • クラウドでの実行と同じクラスタで手元のハードウェアで稼働す るアプリケーションを管理・運用 • 低レイテンシや規制への対応が必要な場合もEKSによるアプリ ケーション管理が可能に ❸ • EC2ベアメタルインスタンスで稼働 • VMwareソフトウェアへの管理者アクセスが可能 • セルフマネージド型&パートナーによるマネージド型 ❶ • AWSの最新Foundation Model ❷Amazon SageMaker Unified Studio • データ処理、SQLによる分析、AI/MLモデル開発、⽣成AIアプリ 開発に利用されるAWSのツールを統合 ❸ • Amazon SageMaker Unified Studioに統合され、その⼀部とし て提供 • ⽣成AIアプリケーションを素早く構築・カスタマイズするための インタフェースを提供 ❹ • ユーザからのリクエストに基づいて、最も低いコストで必要な品 質の応答が期待できるモデルにリクエストを動的にルーティング する ❺Amazon Bedrock Prompt Caching • 複数回呼び出されるプロンプトとその応答をキャッシュすること で効率化する
1.従来の境界を超えるAI/ML Innovationのためのクラウドインフラの提供: • スタック、ビルディングブロック、プロセスなどの固定概念からの脱却 • 「SOFT」インフラと「HARD」インフラが効率よく動作するためのエコシステムの形成 2.真のAIインフラへのシフト: • AWSサービスのイノベーションから見られるように、AI専用インフラストラクチャが進化中 •
従来型のクラウドリソースの転用から、真のAI最適化ソリューションへのシフトがトレンド
1.AIOps:可観測性、耐障害性、拡張性 • Amazon BedrockのAutomated Reasoning Check & Multimodal toxicity detection
with image supportを活用した高度なAPM分析 • Amazon Qによる包括的なシステムインサイトを活用したAI駆動の運用管理 2.NextGenのクラウドマイグレーションとクラウドインフラの再考: • EKS Hybrid Nodesを活用し、ハイブリッドAI/ML基盤を実現 • モデル配信を最適化するためのインテリジェントなワークロードルーティングとキャッ シング戦略の実装 • クラウドネイティブの原則を取り入れつつ運用効率を維持する移行パターンの開発
ありがとうございました キンドリルジャパン株式会社 叶 奕池(ICHICHI) Infrastructure/Cloud Architect