Upgrade to Pro — share decks privately, control downloads, hide ads and more …

【DevelopersIO 2024】AI 半可通なのにエッジ AI 機能を全力で解説してみる...

maroon1st
August 05, 2024

【DevelopersIO 2024】AI 半可通なのにエッジ AI 機能を全力で解説してみる 〜Cloudflare の場合〜

2024年7月23日に開催した「Classmethod Odyssey Online Event Day8」での登壇資料です。
https://event.classmethod.jp/odyssey-online?day8

maroon1st

August 05, 2024
Tweet

More Decks by maroon1st

Other Decks in Programming

Transcript

  1. Who am I? ⼤栗 宗(@maroon1st) ⽇系 SIer → クラスメソッド → 某外資

    → クラスメソッド (2 回⽬) Cloudflare のプリセールスでクラウド⼆⼑流エンジニア • Cloudflare, Google Cloud, AWS, etc • Google Cloud Partner Top Engineer 2023, 2024 • 2022, 2023 Japan AWS Top Engineers (Database) 6
  2. OWASP Top 10 for LLMs LLM01: プロンプト‧インジェク ション LLM02: 安全が確認されていない出

    ⼒ハンドリング LLM03: 訓練データの汚染 LLM04: モデルのDoS LLM05: サプライチェーンの脆弱性 12 LLM06: 機微情報の漏えい LLM07: 安全が確認されていないプ ラグイン設計 LLM08: 過剰な代理⾏為 LLM09: 過度の信頼 LLM10: モデルの盗難
  3. ⽣成 AI アプリケーションの構成 15 Client ⼩規模/中規模 モデル ローカルデータ AI Apps

    AI Provider AI ベンダー/ メガクラウド メガクラウド /サーバー ホスティング オンプレミス /データ センター Google Cloud Vertex AI Amazon Bedrock Workers AI ⼩規模モデル エッジコン ピューティング Vectorize Workers Edge/ Network Edge/ Network AI Gateway 可観測性 信頼性 スケーラビリティ Firewall for AI セキュリティ
  4. Cloudflare の AI プロダクト 攻めの AI 機能 • Workers AI

    • Vectorize 16 守りの AI 機能 • AI Gateway • Firewall for AI
  5. ⽣成 AI アプリケーションの構成 17 Client ⼩規模/中規模 モデル ローカルデータ AI Apps

    AI Provider AI ベンダー/ メガクラウド メガクラウド /サーバー ホスティング オンプレミス /データ センター Google Cloud Vertex AI Amazon Bedrock Workers AI ⼩規模モデル エッジコン ピューティング Vectorize Workers Edge/ Network Edge/ Network AI Gateway 可観測性 信頼性 スケーラビリティ Firewall for AI セキュリティ
  6. Workers AI 19 Leveling up Workers AI: general availability and

    more new capabilities https://blog.cloudflare.com/workers-ai-ga-huggingface-loras-python-support エッジコンピューティングから WebGPU を活⽤ 世界中のデータセンター (150以上の都市※1)で GPUを導⼊済み ※1:2024年4⽉時点
  7. Workers AI Embedded Function calling Workers AI で Function calling

    をシンプルに 21 https://blog.cloudflare.com/embedded-function-calling/
  8. ⽣成 AI アプリケーションの構成 22 Client ⼩規模/中規模 モデル ローカルデータ AI Apps

    AI Provider AI ベンダー/ メガクラウド メガクラウド /サーバー ホスティング オンプレミス /データ センター Google Cloud Vertex AI Amazon Bedrock Workers AI ⼩規模モデル エッジコン ピューティング Workers Edge/ Network Edge/ Network AI Gateway 可観測性 信頼性 スケーラビリティ Firewall for AI セキュリティ Vectorize
  9. ⽣成 AI アプリケーションの構成 24 Client ⼩規模/中規模 モデル ローカルデータ AI Apps

    AI Provider AI ベンダー/ メガクラウド メガクラウド /サーバー ホスティング オンプレミス /データ センター Google Cloud Vertex AI Amazon Bedrock Workers AI ⼩規模モデル エッジコン ピューティング Vectorize Workers Edge/ Network Edge/ Network AI Gateway 可観測性 信頼性 スケーラビリティ Firewall for AI セキュリティ
  10. AI Gateway アプリケーションと AI API の間にプロキシとして配置します。 • オブザーバビリティ ◦ 複数の

    AI プロバイダーの メトリクスを収集‧分析 ◦ リアルタイムにロギング • キャッシングやレート制限 • エンドポイントを統合するユニバーサルエンドポイントを 提供し、エラー発⽣時にフォールバックして耐障害性を向上 25 https://blog.cloudflare.com/ai-gateway-is-generally-available
  11. ⽣成 AI アプリケーションの構成 29 Client ⼩規模/中規模 モデル ローカルデータ AI Apps

    AI Provider AI ベンダー/ メガクラウド メガクラウド /サーバー ホスティング オンプレミス /データ センター Google Cloud Vertex AI Amazon Bedrock Workers AI ⼩規模モデル エッジコン ピューティング Vectorize Workers Edge/ Network Edge/ Network AI Gateway 可観測性 信頼性 スケーラビリティ Firewall for AI セキュリティ
  12. Firewall for AI OWASP Top 10 for LLMs に代表されるような 攻撃から

    AI アプリケーションを守る 30 Developing https://blog.cloudflare.com/firewall-for-ai
  13. OWASP Top 10 for LLMs LLM01: プロンプト‧インジェク ション LLM02: 安全が確認されていない出

    ⼒ハンドリング LLM03: 訓練データの汚染 LLM04: モデルのDoS LLM05: サプライチェーンの脆弱性 31 LLM06: 機微情報の漏えい LLM07: 安全が確認されていないプ ラグイン設計 LLM08: 過剰な代理⾏為 LLM09: 過度の信頼 LLM10: モデルの盗難
  14. Cloudflare の AI ソリューション • Cloudflare は AI を活⽤する様々な場⾯に対応で き、AI

    をエッジに拡張して簡単に利⽤できる • AI にもオブザーバビリティの考え⽅が必要 • AI だからこそセキュリティ対策が必要 32