【DevelopersIO 2024】AI 半可通なのにエッジ AI 機能を全力で解説してみる〜Cloudflare の場合〜

AI 半可通なのにエッジ AI 機能を全⼒で解説してみる〜Cloudﬂare の場合〜 2024.7.23 アライアンス事業部⼤栗宗

Xへの投稿の際は、ハッシュタグ #cm_odyssey でお願いいたします。 2 お願い

「半可通」とは？ 3

”いいかげんな知識しかないのに通⼈ぶること。また、その⼈や、そのさま。” デジタル⼤辞泉（⼩学館） 4

Disclaimer 本セッションはタイトル通り登壇者は「AI 半可通」です AI についていいかげんな知識しかないので⽣暖かい⽬で⾒守ってください 5

Who am I? ⼤栗宗（@maroon1st）⽇系 SIer → クラスメソッド → 某外資
→ クラスメソッド (2 回⽬) Cloudﬂare のプリセールスでクラウド⼆⼑流エンジニア • Cloudﬂare, Google Cloud, AWS, etc • Google Cloud Partner Top Engineer 2023, 2024 • 2022, 2023 Japan AWS Top Engineers (Database) 6

第四次 AI ブーム 7

ブームに乗ってクラスメソッドも 9

⽣成AI環境構築サービス「AI-Starter」で各種クラウドのモデルに対応 10

⽣成 AI 時代はメガクラウドと AI プロバイダーの併⽤が普通になってきている 11

OWASP Top 10 for LLMs LLM01: プロンプト‧インジェクション LLM02: 安全が確認されていない出
⼒ハンドリング LLM03: 訓練データの汚染 LLM04: モデルのDoS LLM05: サプライチェーンの脆弱性 12 LLM06: 機微情報の漏えい LLM07: 安全が確認されていないプラグイン設計 LLM08: 過剰な代理⾏為 LLM09: 過度の信頼 LLM10: モデルの盗難

LLM アプリのリスクの所在箇所 13 https://owasp.org/www-project-top-10-for-large-language-model-applications/llm-top-10-governance-doc/LLM_AI_Security_and_Governance_Checklist-v1_1_JP.pdf

アプリケーションの実装側で考慮すべきリスクが多数！ 14

⽣成 AI アプリケーションの構成 15 Client ⼩規模/中規模モデルローカルデータ AI Apps
AI Provider AI ベンダー/ メガクラウドメガクラウド /サーバーホスティングオンプレミス /データセンター Google Cloud Vertex AI Amazon Bedrock Workers AI ⼩規模モデルエッジコンピューティング Vectorize Workers Edge/ Network Edge/ Network AI Gateway 可観測性信頼性スケーラビリティ Firewall for AI セキュリティ

Cloudﬂare の AI プロダクト攻めの AI 機能 • Workers AI
• Vectorize 16 守りの AI 機能 • AI Gateway • Firewall for AI

Workers AI Workers AI を使⽤して独⾃のコードから Cloudﬂare ネットワーク上でサーバレスに機械学習モデルを実⾏できます。 18

Workers AI 19 Leveling up Workers AI: general availability and
more new capabilities https://blog.cloudflare.com/workers-ai-ga-huggingface-loras-python-support エッジコンピューティングから WebGPU を活⽤世界中のデータセンター（150以上の都市※1）で GPUを導⼊済み ※1：2024年4⽉時点

Workers AI 様々なオープンモデル（50以上）に対応しており Hugging Face とも連携 20

Workers AI Embedded Function calling Workers AI で Function calling
をシンプルに 21 https://blog.cloudflare.com/embedded-function-calling/

AI Provider AI ベンダー/ メガクラウドメガクラウド /サーバーホスティングオンプレミス /データセンター Google Cloud Vertex AI Amazon Bedrock Workers AI ⼩規模モデルエッジコンピューティング Workers Edge/ Network Edge/ Network AI Gateway 可観測性信頼性スケーラビリティ Firewall for AI セキュリティ Vectorize

Vectorize Cloudﬂare 上で動作するベクトルデータベースエッジで RAG（検索拡張⽣成）を実装できる 23 Beta https://developers.cloudflare.com/reference-architecture/diagrams/ai/ai-rag/ https://js.langchain.com/v0.1/docs/integrations/vectorstores/cloudflare_vectorize/

AI Gateway アプリケーションと AI API の間にプロキシとして配置します。 • オブザーバビリティ ◦ 複数の
AI プロバイダーのメトリクスを収集‧分析 ◦ リアルタイムにロギング • キャッシングやレート制限 • エンドポイントを統合するユニバーサルエンドポイントを提供し、エラー発⽣時にフォールバックして耐障害性を向上 25 https://blog.cloudflare.com/ai-gateway-is-generally-available

AI Gateway AI プロバイダーのオブザーバビリティを確保 26 https://blog.cloudflare.com/ai-gateway-is-generally-available

AI Gateway レスポンスのキャッシュやレート制限 27

AI Gateway AI API に対してユニバーサルエンドポイントを提供して、エラー発⽣時に別の API へフォールバック 28 https://blog.cloudflare.com/ai-gateway-is-generally-available

Firewall for AI OWASP Top 10 for LLMs に代表されるような攻撃から
AI アプリケーションを守る 30 Developing https://blog.cloudflare.com/firewall-for-ai

OWASP Top 10 for LLMs LLM01: プロンプト‧インジェクション LLM02: 安全が確認されていない出
⼒ハンドリング LLM03: 訓練データの汚染 LLM04: モデルのDoS LLM05: サプライチェーンの脆弱性 31 LLM06: 機微情報の漏えい LLM07: 安全が確認されていないプラグイン設計 LLM08: 過剰な代理⾏為 LLM09: 過度の信頼 LLM10: モデルの盗難

Cloudﬂare の AI ソリューション • Cloudﬂare は AI を活⽤する様々な場⾯に対応でき、AI
をエッジに拡張して簡単に利⽤できる • AI にもオブザーバビリティの考え⽅が必要 • AI だからこそセキュリティ対策が必要 32

【DevelopersIO 2024】AI 半可通なのにエッジ AI 機能を全力で解説してみる...

【DevelopersIO 2024】AI 半可通なのにエッジ AI 機能を全力で解説してみる〜Cloudflare の場合〜

maroon1st

More Decks by maroon1st

Other Decks in Programming

Featured

Transcript

AI 半可通なのにエッジ AI 機能を全⼒で解説してみる〜Cloudﬂare の場合〜 2024.7.23 アライアンス事業部⼤栗宗

Xへの投稿の際は、ハッシュタグ #cm_odyssey でお願いいたします。 2 お願い

「半可通」とは？ 3

”いいかげんな知識しかないのに通⼈ぶること。また、その⼈や、そのさま。” デジタル⼤辞泉（⼩学館） 4

Disclaimer 本セッションはタイトル通り登壇者は「AI 半可通」です AI についていいかげんな知識しかないので⽣暖かい⽬で⾒守ってください 5

Who am I? ⼤栗宗（@maroon1st）⽇系 SIer → クラスメソッド → 某外資

第四次 AI ブーム 7

ブームに乗ってクラスメソッドも 9

⽣成AI環境構築サービス「AI-Starter」で各種クラウドのモデルに対応 10

⽣成 AI 時代はメガクラウドと AI プロバイダーの併⽤が普通になってきている 11

OWASP Top 10 for LLMs LLM01: プロンプト‧インジェクション LLM02: 安全が確認されていない出

LLM アプリのリスクの所在箇所 13 https://owasp.org/www-project-top-10-for-large-language-model-applications/llm-top-10-governance-doc/LLM_AI_Security_and_Governance_Checklist-v1_1_JP.pdf

アプリケーションの実装側で考慮すべきリスクが多数！ 14

⽣成 AI アプリケーションの構成 15 Client ⼩規模/中規模モデルローカルデータ AI Apps

Cloudﬂare の AI プロダクト攻めの AI 機能 • Workers AI

⽣成 AI アプリケーションの構成 17 Client ⼩規模/中規模モデルローカルデータ AI Apps

Workers AI Workers AI を使⽤して独⾃のコードから Cloudﬂare ネットワーク上でサーバレスに機械学習モデルを実⾏できます。 18

Workers AI 19 Leveling up Workers AI: general availability and

Workers AI 様々なオープンモデル（50以上）に対応しており Hugging Face とも連携 20

Workers AI Embedded Function calling Workers AI で Function calling

⽣成 AI アプリケーションの構成 22 Client ⼩規模/中規模モデルローカルデータ AI Apps

Vectorize Cloudﬂare 上で動作するベクトルデータベースエッジで RAG（検索拡張⽣成）を実装できる 23 Beta https://developers.cloudflare.com/reference-architecture/diagrams/ai/ai-rag/ https://js.langchain.com/v0.1/docs/integrations/vectorstores/cloudflare_vectorize/

⽣成 AI アプリケーションの構成 24 Client ⼩規模/中規模モデルローカルデータ AI Apps

AI Gateway アプリケーションと AI API の間にプロキシとして配置します。 • オブザーバビリティ ◦ 複数の

AI Gateway AI プロバイダーのオブザーバビリティを確保 26 https://blog.cloudflare.com/ai-gateway-is-generally-available

AI Gateway レスポンスのキャッシュやレート制限 27

AI Gateway AI API に対してユニバーサルエンドポイントを提供して、エラー発⽣時に別の API へフォールバック 28 https://blog.cloudflare.com/ai-gateway-is-generally-available

⽣成 AI アプリケーションの構成 29 Client ⼩規模/中規模モデルローカルデータ AI Apps

Firewall for AI OWASP Top 10 for LLMs に代表されるような攻撃から

OWASP Top 10 for LLMs LLM01: プロンプト‧インジェクション LLM02: 安全が確認されていない出

Cloudﬂare の AI ソリューション • Cloudﬂare は AI を活⽤する様々な場⾯に対応でき、AI

【DevelopersIO 2024】AI 半可通なのにエッジ AI 機能を全力で解説してみる...

【DevelopersIO 2024】AI 半可通なのにエッジ AI 機能を全力で解説してみる 〜Cloudflare の場合〜

More Decks by maroon1st

Other Decks in Programming

Featured

Transcript

【DevelopersIO 2024】AI 半可通なのにエッジ AI 機能を全力で解説してみる〜Cloudflare の場合〜