Upgrade to Pro — share decks privately, control downloads, hide ads and more …

【DevelopersIO 2024】AI 半可通なのにエッジ AI 機能を全力で解説してみる...

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.
Avatar for maroon1st maroon1st
August 05, 2024

【DevelopersIO 2024】AI 半可通なのにエッジ AI 機能を全力で解説してみる 〜Cloudflare の場合〜

2024年7月23日に開催した「Classmethod Odyssey Online Event Day8」での登壇資料です。
https://event.classmethod.jp/odyssey-online?day8

Avatar for maroon1st

maroon1st

August 05, 2024
Tweet

More Decks by maroon1st

Other Decks in Programming

Transcript

  1. Who am I? ⼤栗 宗(@maroon1st) ⽇系 SIer → クラスメソッド → 某外資

    → クラスメソッド (2 回⽬) Cloudflare のプリセールスでクラウド⼆⼑流エンジニア • Cloudflare, Google Cloud, AWS, etc • Google Cloud Partner Top Engineer 2023, 2024 • 2022, 2023 Japan AWS Top Engineers (Database) 6
  2. OWASP Top 10 for LLMs LLM01: プロンプト‧インジェク ション LLM02: 安全が確認されていない出

    ⼒ハンドリング LLM03: 訓練データの汚染 LLM04: モデルのDoS LLM05: サプライチェーンの脆弱性 12 LLM06: 機微情報の漏えい LLM07: 安全が確認されていないプ ラグイン設計 LLM08: 過剰な代理⾏為 LLM09: 過度の信頼 LLM10: モデルの盗難
  3. ⽣成 AI アプリケーションの構成 15 Client ⼩規模/中規模 モデル ローカルデータ AI Apps

    AI Provider AI ベンダー/ メガクラウド メガクラウド /サーバー ホスティング オンプレミス /データ センター Google Cloud Vertex AI Amazon Bedrock Workers AI ⼩規模モデル エッジコン ピューティング Vectorize Workers Edge/ Network Edge/ Network AI Gateway 可観測性 信頼性 スケーラビリティ Firewall for AI セキュリティ
  4. Cloudflare の AI プロダクト 攻めの AI 機能 • Workers AI

    • Vectorize 16 守りの AI 機能 • AI Gateway • Firewall for AI
  5. ⽣成 AI アプリケーションの構成 17 Client ⼩規模/中規模 モデル ローカルデータ AI Apps

    AI Provider AI ベンダー/ メガクラウド メガクラウド /サーバー ホスティング オンプレミス /データ センター Google Cloud Vertex AI Amazon Bedrock Workers AI ⼩規模モデル エッジコン ピューティング Vectorize Workers Edge/ Network Edge/ Network AI Gateway 可観測性 信頼性 スケーラビリティ Firewall for AI セキュリティ
  6. Workers AI 19 Leveling up Workers AI: general availability and

    more new capabilities https://blog.cloudflare.com/workers-ai-ga-huggingface-loras-python-support エッジコンピューティングから WebGPU を活⽤ 世界中のデータセンター (150以上の都市※1)で GPUを導⼊済み ※1:2024年4⽉時点
  7. Workers AI Embedded Function calling Workers AI で Function calling

    をシンプルに 21 https://blog.cloudflare.com/embedded-function-calling/
  8. ⽣成 AI アプリケーションの構成 22 Client ⼩規模/中規模 モデル ローカルデータ AI Apps

    AI Provider AI ベンダー/ メガクラウド メガクラウド /サーバー ホスティング オンプレミス /データ センター Google Cloud Vertex AI Amazon Bedrock Workers AI ⼩規模モデル エッジコン ピューティング Workers Edge/ Network Edge/ Network AI Gateway 可観測性 信頼性 スケーラビリティ Firewall for AI セキュリティ Vectorize
  9. ⽣成 AI アプリケーションの構成 24 Client ⼩規模/中規模 モデル ローカルデータ AI Apps

    AI Provider AI ベンダー/ メガクラウド メガクラウド /サーバー ホスティング オンプレミス /データ センター Google Cloud Vertex AI Amazon Bedrock Workers AI ⼩規模モデル エッジコン ピューティング Vectorize Workers Edge/ Network Edge/ Network AI Gateway 可観測性 信頼性 スケーラビリティ Firewall for AI セキュリティ
  10. AI Gateway アプリケーションと AI API の間にプロキシとして配置します。 • オブザーバビリティ ◦ 複数の

    AI プロバイダーの メトリクスを収集‧分析 ◦ リアルタイムにロギング • キャッシングやレート制限 • エンドポイントを統合するユニバーサルエンドポイントを 提供し、エラー発⽣時にフォールバックして耐障害性を向上 25 https://blog.cloudflare.com/ai-gateway-is-generally-available
  11. ⽣成 AI アプリケーションの構成 29 Client ⼩規模/中規模 モデル ローカルデータ AI Apps

    AI Provider AI ベンダー/ メガクラウド メガクラウド /サーバー ホスティング オンプレミス /データ センター Google Cloud Vertex AI Amazon Bedrock Workers AI ⼩規模モデル エッジコン ピューティング Vectorize Workers Edge/ Network Edge/ Network AI Gateway 可観測性 信頼性 スケーラビリティ Firewall for AI セキュリティ
  12. Firewall for AI OWASP Top 10 for LLMs に代表されるような 攻撃から

    AI アプリケーションを守る 30 Developing https://blog.cloudflare.com/firewall-for-ai
  13. OWASP Top 10 for LLMs LLM01: プロンプト‧インジェク ション LLM02: 安全が確認されていない出

    ⼒ハンドリング LLM03: 訓練データの汚染 LLM04: モデルのDoS LLM05: サプライチェーンの脆弱性 31 LLM06: 機微情報の漏えい LLM07: 安全が確認されていないプ ラグイン設計 LLM08: 過剰な代理⾏為 LLM09: 過度の信頼 LLM10: モデルの盗難
  14. Cloudflare の AI ソリューション • Cloudflare は AI を活⽤する様々な場⾯に対応で き、AI

    をエッジに拡張して簡単に利⽤できる • AI にもオブザーバビリティの考え⽅が必要 • AI だからこそセキュリティ対策が必要 32