Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Nutanix Kubernetes PlatformでLLMを動かす話
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
jyoshise
November 27, 2024
530
0
Share
Nutanix Kubernetes PlatformでLLMを動かす話
Nutanix Meetup 24.11の資料です。
jyoshise
November 27, 2024
More Decks by jyoshise
See All by jyoshise
GitLab Duo Agent Platform + Local LLMサービングで幸せになりたい
jyoshise
0
600
米軍Platform One / Black Pearlに学ぶ極限環境DevSecOps
jyoshise
2
800
AIがコード書きすぎ問題にはAIで立ち向かえ
jyoshise
14
14k
CNDT2023_Nutanix_jyoshise
jyoshise
0
610
クラウドネイティブインフラおじさんがNutanixに入社することになったので以下略
jyoshise
0
1.3k
これは分散KVS? NoSQL? NewSQL? 謎の HarperDBにせまる
jyoshise
0
630
全てがクラウドネイティブで良いのか。その謎を明らかにすべく我々はエンプラの奥地に向かった
jyoshise
8
6k
Kubeadmによるクラスタアップグレード・その光と闇
jyoshise
3
4.8k
Kubernetes Meetup Tokyo #26 / Recap: Kubecon Keynote by Walmart
jyoshise
6
3.5k
Featured
See All Featured
Chasing Engaging Ingredients in Design
codingconduct
0
200
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.8k
エンジニアに許された特別な時間の終わり
watany
107
240k
How GitHub (no longer) Works
holman
316
150k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
61
44k
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
220
sira's awesome portfolio website redesign presentation
elsirapls
0
270
Tell your own story through comics
letsgokoyo
1
930
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
23k
Building Applications with DynamoDB
mza
96
7.1k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
350
Transcript
Nutanix Kubernetes Platform LLM @jyoshise A.K.A. GAFA
None
Nutanix Enterprise AI 登場 3
Nutanix Enterprise AI が提供するもの 4 あらゆる Kubernetes Nutanix Kubernetes Platform
| CNCF準拠 | パブリッククラウド Nutanix Cloud Infrastructure セキュアなインフラ | レジリエントストレージ | ハイパーコンバージェンス コアインフラ ストラクチャー AI と モダンアプリ 生成AIアプリを展開 生成AIアプリを構築 エンタープライズ モデル リポジトリ ロールベース アクセス コントロール 推論 エンドポイント サービス 日々の AI 運用 Nutanix Enterprise AI お好みの LLM | セキュアなエンドポイント API | あらゆる Kubernetes
Nutanix Enterprise AIの動作は? 5 APIとエンドポイント、LLM、インフラ ストラクチャを監査、監視 Nutanix Enterprise AIを あらゆるKubernetes上
で展開して利用 1. Nutanix Kubernetes ® Platform Red Hat OpenShift Azure AKS | AWS EKS | GCP Rancher | Docker Nutanix Enterprise AI インターフェイスにログ インし、シンプルに使い たいLLMを選択して展開 2. 自社のモデル 4. APIクレデンシャルを開発者 またはアプリケーションオー ナーに共有 テストモードアクセスで生成AI に質問 APIトークン提供: B23014KJH…… API ? セキュアなモデルを利用する ためのAPIを作成し、モデル へのアクセスを検証 3. ユーザーベースのAPI を作成しモデルへアク セス 自社のモデル API API API Endpoint API B23014KJH …
ふん、Nutanix Enterprise AIっていうのかい。 贅沢な名だね。 でもこれってただの「推論APIサーバー」では?
そうだが?
DEMO
• プライベートなLLMをプライベートな環境で動 かしてAPIエンドポイントを提供します(OpenAIとかがやってるこ とのプライベート版) • どこでも動きます(Any Kubernetes) • NCI,NUS,NKP,NDK,NDBとの組み合わせで 幸せになれます
5秒でわかるNutanix Enterprise AI (略してNAI) © 2023 Nutanix 9
10 Nutanix AI ソリューション概要 GPU搭載サーバー 生成 AI アプリ Nutanix Enterprise
AI Nutanix Kubernetes Platform ファウンデーション モデル Nutanix Cloud Infrastructure GPT-in-a-Box 2.0 Nutanix Unified Storage サイジング/ インテグレーションサービス New New GPU搭載サーバー 生成 AI アプリ Nutanix Enterprise AI パートナーの Kubernetes ファウンデーション モデル Nutanix Cloud Infrastructure あらゆるCNCF準拠K8s上 New 生成 AI アプリ Nutanix Enterprise AI Amazon EKS Azure AKS, Google Cloud GKE ファウンデーション モデル パブリッククラウド上 ネイティブ GPUが利用できるクラウド New
AIを加速: エッジからマルチクラウドまで 11 データセンター で再訓練 データセンター で再訓練 データセンター パブリッククラウド クラウドを再訓練
エッジ エッジでNutanixソフトウェアを活用: 小規模な常時接続されていないエッジロケ ーションでのコンパクトなカスタマイズさ れたAI推論を稼働させるのに理想的 エッジ エッジ データセンターで Nutanixソフトウェア を活用: モデルのトレーニング、クラウドで作られたLLM のカスタマイズのためのデータ主権を備えたAI対 応インフラストラクチャ データセンター クラウドを再訓練 パブリッククラウドでNutanixソフトウェアを活用: LLMにアクセスするための一貫性のあるデータ主権 を備えたインフラストラクチャ データセンターを またがり再訓練
Xinference • Xorbits社によるOSS • Pythonで動作 • LLM, Embedding, Rerank, Image,
Audioなど 多様なModelのServingに対応 そこまでガチじゃない用途(ご自宅など)には、ふつうに GPU仮想マシンでOSS推論サーバーを動かすのもあり Ollama • Ollama ProjectによるOSS • Goで動作 • LLMとEmbedding Modelに対応
よろしい。で、どうすればAIが使えるの?
DataRobot © 2023 Nutanix 14 • 今のDataRobotを(SaaSではなく)プ ライベート環境で利用するためには Kubernetesが必須 •
プライベートで使うからにはスケーラ ブルでセキュアなストレージが必須 • なのでNKPは最適
Dify Dify • 中国LangGenius社によるSaaS/OSS • ノーコードでAIアプリケーションを作成/ 公開できるプラットフォーム • 豊富なテンプレート •
多くのモデルプロバイダーをサポート • RAGパイプライン作成機能 • カスタムツールやAPIの統合
DEMO
AI Platform Developer User RDB Vector DB Model Serving Block
Storage Object Storage File Storage Compute (GPU) Nutanix Cloud Infrastructure Access Control The Platform for Platforms = Nutanix Nutanix Kubernetes Platform Nutanix AOS/ Unified Storage Nutanix Database Service Nutanix Enterprise AI
• DifyのModel ProviderとしてNAIを追加す る(OSSにContribute) • ジョジョデモの構築手順をアドベントカレン ダーで公開 GAFA社長の宿題 © 2023
Nutanix 18
Thank You 19 © 2023 Nutanix