Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AI AgentOps LT大会(2025/04/16) Algomatic伊藤発表資料

AI AgentOps LT大会(2025/04/16) Algomatic伊藤発表資料

2025/04/16に開催されたAI Agent Ops LT大会 (https://mlops.connpass.com/event/347046/) にて発表した際の資料です。
マーケティング向けクリエイティブ生成AIプロダクトにおけるクリエイティブ評価の事例について紹介しました。

伊藤光祐

April 16, 2025
Tweet

Other Decks in Technology

Transcript

  1. © 2025 Algomatic Inc. 4 ネオデザインAI活⽤イメージ例 AIによるアウトプット Input Input 貴社既存クリエイティブ

    新規訴求要件 商品画像 商品名 テキスト 【例】 和漢バランスEX 【例】 4⽉2⽇から セール開始! 管理画⾯から 必要な情報を インプット パターンのクリエイティブ提案が AIにより複数⽣成される 新規訴求商品 既存クリエイティブ
  2. 8 LLM as a Judgeによる⾃動評価 クリエイティブを構成要素に分解し、それらの過不⾜や位置‧サイズをVLMによって評価するといった⾃ 動化を検討中。 検討中の評価フロー 正解 評価対象

    VLM 評価項⽬ 修正時間 要素の過不⾜ 3分 画像要素の位置 1分 画像要素のサイズ 1分 図形要素の位置 1分 図形要素のサイズ 1分 テキスト要素の位置 3分 テキスト要素のサイズ 3分
  3. 9 プロトタイプの評価結果 LLM as a Judge⾃体の評価精度の評価が必要ではあるものの、差分を認識できており、⾃動化ができそう な所感は得られている。 評価項⽬ 修正時間 要素の過不⾜

    3分 画像要素の位置 1分 画像要素のサイズ 1分 図形要素の位置 1分 図形要素のサイズ 1分 テキスト要素の位置 2分 テキスト要素のサイズ 2分 理由※ ロゴ要素が省略されている 縦位置調整が必要 微調整が必要 区切り位置の微調整が必要 ⾼さ‧幅の微調整が必要 ⾏間や位置がやや異なる 微妙に違いが⾒られる 正解 評価対象 GPT-4.1を使った場合の評価結果例 ※本当はもっと⻑い⽂章が出⼒されていますが、収まりきらないので要約しています。