生成 AI のセキュリティと生産性を両立させる

© 2023, Amazon Web Services, Inc. or its affiliates. ©
2023, Amazon Web Services, Inc. or its affiliates. 生成 AI のセキュリティと生産性を両立させる Machine Learning Developer Relations Takahiro Kubo

© 2023, Amazon Web Services, Inc. or its affiliates. Agenda
1. 生成 AI への期待とリスク 2. 責任共有モデルに基づくリスクへの対応方法 3. Key Takeaways 2

© 2023, Amazon Web Services, Inc. or its affiliates. 3
自己紹介アマゾンウェブサービスジャパン合同会社 Machine Learning Developer Relations 久保隆宏 (Kubo Takahiro) ミッション「機械学習を実用するなら AWS 」という認知を拡大すること。 10 年以上の業務コンサルタント経験、また研究開発していたテーマをプロダクトとしてリリースした経験をもとにお話しします。

© 2023, Amazon Web Services, Inc. or its affiliates. 機械学習をプロダクトに活かすためのワークショップ
を GitHub で公開 (AWS からの実施には条件あり ) https://github.com/aws-samples/aws-ml-enablement-workshop ワークショップを一部体験できるコミュニティイベントも実施

© 2023, Amazon Web Services, Inc. or its affiliates. 生成
AI は新規ビジネスの創出や業務効率化、顧客との関係にインパクトをもたらす技術 6 創造性会話、ストーリー、画像、動画、音楽など、新しいコンテンツやアイデアを作成生産性あらゆる業種、ユースケース、業界にわたって生産性を大幅に向上関係性顧客や組織全体と繋がるの新しい方法

AI には新たなリスクと課題もある。

AI を活用する上でのリスクと課題知的財産侵害のリスク機密保持のリスク信憑性のリスク ( 例：幻覚 ) 悪意ある、差別的な生成のリスク

© 2023, Amazon Web Services, Inc. or its affiliates. 信憑性のリスク（例：幻覚）
プロンプトまたは外部知識の入力から、もっともらしいが虚偽である出力を行うリスクがある CVE-2011-3192 は Apache Killer の脆弱性で出力内容とは大きく異なる

© 2023, Amazon Web Services, Inc. or its affiliates. 悪意ある、差別的な生成のリスク
個人または組織を憎悪、脅迫、侮辱する基盤モデルの出力 Emacs でも試してみてください

© 2023, Amazon Web Services, Inc. or its affiliates. 機密保持のリスク
送信したプロンプトが学習された場合、他者のプロンプトを通じて情報が流出する可能性がある。 CodexLeaks: Privacy Leaks from Code Generation Language Models in GitHub Copilot コードを生成する大規模言語モデルに対し、 account.password=“ の続きなどを生成させたところ、一部それらしい出力得られることを確認した論文が報告される。

© 2023, Amazon Web Services, Inc. or its affiliates. 責任ある
AI を実現するための課題制御性 AI の監視と統制を行うメカニズムプライバシー & セキュリティ適切に入手し保護されたデータとモデル安全性有害な出力と誤用の防止公平さ異なるグループに対する影響を考慮統治 AI の開発者と共に提供プロセスのベストプラクティスを実現透明性意思決定者に情報と選択肢を提供する信憑性とロバストネス予期せぬ事態や敵対的な入力に対しても正確な応答を買える説明可能性出力に対する理解と評価

© 2023, Amazon Web Services, Inc. or its affiliates. 新たなリスクと課題を
どう解決する ?

© 2023, Amazon Web Services, Inc. or its affiliates. 責任ある
AI を、モデルの開発から利用までのプロセス全体で実現する 18 学習データの取得基礎モデルの開発プロンプト前処理出力後処理出力の影響

© 2023, Amazon Web Services, Inc. or its affiliates. 責任共有モデルによる分担
19 責任ある AI ・モデルの提供責任ある提供に欠かせないサービス提供責任ある AI の実装・監視・運用

© 2023, Amazon Web Services, Inc. or its affiliates. AWS
はどのように責任あるモデルを開発し提供しているか ? 20 学習データの取得基礎モデルの開発プロンプト前処理出力後処理出力の影響

つの施策責任ある AI を理論から実践へと変える責任ある AI の基盤となる研究を推進責任ある AI の関係者を巻き込むモデル開発過程全体で責任ある AI を実現

© 2023, Amazon Web Services, Inc. or its affiliates. Amazon
Science における Responsible AI の研究 22 https://www.amazon.science/blog/responsible-ai-in-the-generative-era

© 2023, Amazon Web Services, Inc. or its affiliates. AWS
AI サービスカード 23 責任ある AI を推進するための透明性リソース • AWS AI サービスの使用目的と公平性に関する考慮事項を文書化しています。 • AWS の包括的な開発プロセスを反映しています。 • 5 つの新しい AI サービスカードが re: Invent 2023 で公開されました Amazon Textract AnalyzeID Amazon Rekognition Face Matching Amazon Comprehend Detect PII Amazon Transcribe Toxicity Detection Amazon Transcribe – Batch (English-US) AWS HealthScribe Amazon Titan Text Amazon Rekognition Face Liveness

Amazon Titan FM Amazon の構築した高性能かつ責任ある AI を実現する基盤モデル顧客提供のデータから有害なコンテンツを検出・削除し、不適切なユーザー入力を拒否し、モデル出力をフィルタリングするよう構築。第三者による知的財産権侵害請求に対する弁護と補償 ( AWS Service Terms 50.10 参照 ) Amazon Titan で生成された画像には見えないウォーターマークが含まれ、偽造を防止。安全な学習データを取得

© 2023, Amazon Web Services, Inc. or its affiliates. 責任を持って生成
AI を構築するためのベストプラクティスを実践 25 ユースケースを定義する。具体的で範囲が狭いほど良いアノテーターの教育と多様性を重視するユースケース固有のリスクを評価する ( 金融・医療等 ) テスト、テスト、テスト企画、学習、テスト、統合、フィードバックのライフサイクルを設計するライフサイクルにおける説明責任と対策のオーナーシップを明確にする

© 2023, Amazon Web Services, Inc. or its affiliates. さらに詳しく
将来の生成 AI モデルの開発に向けた新たな自発的取り組み ✓ 社内外からの攻撃検証 (red-teaming) ✓ セキュリティリスク情報 ✓ 音声・画像が AI によって生成されたものかどうかを判断するメカニズム ✓ サイバーセキュリティと内部脅威対策 ✓ 第三者による問題の発見と報告 ✓ モデルの機能、制限事項、適切な使用領域 ✓ AI がもたらす社会的リスクに関する研究 ✓ 社会の課題に対処する AI システム規制や標準化への取り組みへの参加 Amazon はホワイトハウス、テクノロジー組織、AI コミュニティに加わり、責任ある安全な人工知能の利用を推進しています。

© 2023, Amazon Web Services, Inc. or its affiliates. お客様が責任ある
AI を提供するために AWS はどのようなサービスを提供しているか ? 27 学習データの取得基礎モデルの開発プロンプト前処理出力後処理出力の影響

© 2023, Amazon Web Services, Inc. or its affiliates. まず当たり前セキュリティーの実装に必要な機能を提供
28 仮想プライベートクラウド (VPC) から Bedrock API にアクセスできる。転送・保管されるデータはすべて暗号化される Fine Tuning に使用するデータは保護・暗号化され、お客様専用にコピーしたモデルを学習する。 Amazon および 3rd Party 本体のモデル学習には一切使われない AWS は 300 を超えるセキュリティサービスと機能を提供

© 2023, Amazon Web Services, Inc. or its affiliates. 既存の
AWS サービスを組み合わせた責任ある AI の構成 29 1. 画像を生成するテキストを API エンドポイントに送信 2. Lambda で処理を開始。 2.1-2.2 Amazon Comprehend でテキストの表現を確認 2.3-2.4 Amazon SageMaker で Stable Diffusion により画像を生成 2.4-2.5 Amazon Rekognition で画像の安全性を確認 3. 安全と確認された画像を返す AWS Lambda 2.5 Amazon API Gateway

プレビュー版が利用可能になりましたユースケース固有のポリシーを設定することで、有害なトピックに対する返答の拒否やコンテンツのフィルタリングを実現。応答に含まれる個人情報 (PII) を検出しマスクする等編集も可能になる予定。 N EW Guardrails for Amazon Bedrock

© 2023, Amazon Web Services, Inc. or its affiliates. プロンプトの前処理
( 受容性評価 ) 、出力のフィルタリング 31 有害、性的など各テーマごとフィルタの強度を設定できる投資や医療に関するアドバイスはしないよう設定できる

Amazon Bedrock で利用可能なモデルに対し、ビルトインあるいは持ち込みのデータセットを用いて精度や有害性、プロンプト変更への頑健性を評価できる。自動評価以外に、人手の評価も実施可能。 N EW Model Evaluation On Amazon Bedrock プレビュー版が利用可能になりました

© 2023, Amazon Web Services, Inc. or its affiliates. 出力の評価・比較
33 https://aws.amazon.com/jp/blogs/aws/evaluate-compare-and-select-the-best-foundation-models-for-your-use-case-in-amazon-bedrock-preview/

Amazon CodeWhisperer 最高のコーディングコンパニオン検出が困難な脆弱性を発見して修正案を提案する。セキュリティスキャンが組み込まれた AI コーディングコンパニオン。出力の影響評価

AI のセキュリティと生産性を両立させるには ? • 新しいリスクと課題を識別する • 信憑性、悪意ある生成、知的財産の侵害、機密情報保持 • 社会から求められる公平性、安全性、ガバナナンス等 • リスクを低減し、課題解決につながる AWS のサービスを選択 • AWS では責任ある基盤モデルの構築を推進 • 基盤モデルに対する入力、また出力を監視できるサービス 36

生成 AI のセキュリティと生産性を両立させる

生成 AI のセキュリティと生産性を両立させる

More Decks by Takahiro Kubo

Other Decks in Technology

Featured

Transcript