Amazon Rekognitionのカスタムモデルで独自のモデレーションモデルをトレーニングする

2024/11/13 データ事業本部鈴木那由太まるクラ勉強会 O N L IN E #3
A m a z on R ekog nitionのカスタムモデルで独自のモデレーションモデルをトレーニングする

目次 2 • コンテンツモデレーションについて • A m az on R
e kog nitionについて • R e kog nitionのカスタムモデレーションの紹介

自己紹介 3 名前：鈴木那由太（スズキナユタ）所属：クラスメソッド株式会社データ事業本部インテグレーション部機械学習チーム現在の業務：
機械学習用途のデータ分析基盤構築機械学習システム構築 X：@nayuyu_ns Osaka

コンテンツモデレーションについて

コンテンツモデレーションについて 5 • ユーザーがコンテンツを作成できるウェブサイトで、無関係・わいせつ・違法・有害・侮辱的な投稿を検出するプロセス • 問題のあるコンテンツに対して削除または警告ラベルを適用し、ユーザーが自分でコンテンツをブロックおよびフィルタリングできるようにすることが目的 • 例：動画配信サービスで再生開始時に警告ラベルが出る

AWSでコンテンツモデレーションをするには 6 必ずしもAmazon Rekognitionのコンテンツモデレーションを使う必要はない • 規制したいシチュエーションの画像・動画 • Rekognitionのコンテンツモデレーションで対応可能 • キャラクターやロゴなど著作権侵害の検出
• 特定の対象であればRekognitionのカスタムラベルで対応可能 • マルチモーダルなLLM • 不適切なテキスト • Amazon Comprehend toxicity detectionによる分析（英語のみ） • Amazon Translate Masking profane機能による、翻訳対象中の不適切な単語のマスク • LLMによる判定 Amazon Web Services ブログ『Amazon Rekognition のカスタムモデレーションを利用して独自のモデルで不適切なコンテンツを検出』を参考 • https://aws.amazon.com/jp/blogs/news/amazon-rekognition-のカスタムモデレーションを利用して独自の/

LLMによる画像のモデレーションの検証 7 最近ではマルチモーダルなLLMが登場しており、テキストだけでなく画像などに対しても抽象的なモデレーションができつつある。ただし、ハルシネーションや再現性の課題はある。 Developers IOブログ『生成AI（Claude 3.5 Sonnet）を使って、画像のモデレーションが可能かどうかを検証してみた』を参考 •
https://dev.classmethod.jp/articles/character-spot-the-difference/ Amazon BedrockからClaude 3.5 Sonnetを利用した例：

Amazon Rekognitionについて

Amazon Rekognitionについて 9 • 画像認識・動画処理向けのAWSのマネージドサービス • 多岐にわたる分析ができる • 顔画像のマッチング •
顔画像の検索 • ラベル検出 • モデレーション(有害性の検出) • 顔の検出と分析 • 画像中のテキスト検出 • 有名人の認識 • 個人用防護具 (PPE) 検出 • 画像のプロパティ分析

Amazon Rekognitionのコンテンツモデレーション 10 • 画像・動画を入力に、警告ラベルをつけてくれる機能 • 現在は、第３レベルカテゴリ粒度で34種 • どちらかというと商品画像などに適しているような所感 <検出の例>
<ラベルのカテゴリの例> • アルコール（L1 – トップレベルカテゴリ） • アルコールの使用（L2 – 第２レベルカテゴリ） • 飲酒（L3 – 第３レベルカテゴリ） • アルコール飲料（L2） ※いらすとやより

Amazon Rekognitionのカスタムモデレーション 11 • “アダプター”を訓練することにより、デフォルトのコンテンツモデレーション機能をカスタマイズできる • 新たな不適切なラベルを追加するのではなく、既存のラベルに割り当てられない画像を、既存ラベルに判定できるようにする機能 ※Amazon Rekognitionのコンソールより

カスタムモデレーションのご紹介

問題設定 13 自社のECサイトで、高級ワインの取引が行われており、配送時に破損するなどトラブルが多発している。そもそも酒類の取引は認めておらず、アルコールに関するアイキャッチを設定できないようにコンテンツモデレーション機能でブロックしているが、高級ワインを表す画像としてレーズンの画像が使われるケースがあり、知らないうちに販売が続いていた。レーズンの画像もアルコールとしてラベル付けしたい。 <問題の画像のサンプル>

画像の用意 14 偽陰性サンプル（50枚） • トレーニング： • 最低 50 個の偽陰性サンプル、または 20
個の偽陽性サンプル • 正しい予測が出る画像 • テスト： • 最低 20 個のサンプル正しい予測が出る画像（10枚）正しい予測が出る画像（10枚）

ラベル付け 15 • Amazon Rekognitionのプロジェクト画面上からできる • 陰性のサンプルにはSafeを付ける • 陽性のサンプルには該当するラベルを付ける <ラベル付けの例>

トレーニング 16 • ラベル付け後に、プロジェクト画面からアダプターのトレーニングを実行できる • 通常は30分〜２時間

アダプターの評価 17 • しきい値を変えることで、テスト用のプロジェクト内のサンプルに対してパフォーマンス評価ができる • モデレーション実行時はアダプターとしきい値を指定して実行する

まとめ 18 • Amazon Rekognitionのカスタムモデレーションを使うことで、デフォルトでは判定されない画像に対しても、ラベルカテゴリを割り当てることができる • ラベル付けなど一連の作業はコンソールより実施できる • 画像や動画に対してモデレーション用のラベルを割り当てる機能のため、特定のオブジェクトの検出はカスタムラベル、
より抽象的な指示はマルチモーダルLLMと、用途に応じたサービスを利用した方がより良い場合がある

Amazon Rekognitionのカスタムモデルで独自のモデレーションモデルをトレーニングする

Amazon Rekognitionのカスタムモデルで独自のモデレーションモデルをトレーニングする

Nayuta S.

More Decks by Nayuta S.

Other Decks in Technology

Featured

Transcript

2024/11/13 データ事業本部鈴木那由太まるクラ勉強会 O N L IN E #3

目次 2 • コンテンツモデレーションについて • A m az on R

自己紹介 3 名前：鈴木那由太（スズキナユタ）所属：クラスメソッド株式会社データ事業本部インテグレーション部機械学習チーム現在の業務：

コンテンツモデレーションについて

Amazon Rekognitionについて

Amazon Rekognitionについて 9 • 画像認識・動画処理向けのAWSのマネージドサービス • 多岐にわたる分析ができる • 顔画像のマッチング •

Amazon Rekognitionのコンテンツモデレーション 10 • 画像・動画を入力に、警告ラベルをつけてくれる機能 • 現在は、第３レベルカテゴリ粒度で34種 • どちらかというと商品画像などに適しているような所感 <検出の例>

カスタムモデレーションのご紹介

画像の用意 14 偽陰性サンプル（50枚） • トレーニング： • 最低 50 個の偽陰性サンプル、または 20

ラベル付け 15 • Amazon Rekognitionのプロジェクト画面上からできる • 陰性のサンプルにはSafeを付ける • 陽性のサンプルには該当するラベルを付ける <ラベル付けの例>

トレーニング 16 • ラベル付け後に、プロジェクト画面からアダプターのトレーニングを実行できる • 通常は30分〜２時間

アダプターの評価 17 • しきい値を変えることで、テスト用のプロジェクト内のサンプルに対してパフォーマンス評価ができる • モデレーション実行時はアダプターとしきい値を指定して実行する