Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20260318_AIによるデザインレビュ〜「画像の美しさ」をスコアに変換する〜
Search
Hiroshi Kato
March 19, 2026
82
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20260318_AIによるデザインレビュ〜「画像の美しさ」をスコアに変換する〜
Hiroshi Kato
March 19, 2026
More Decks by Hiroshi Kato
See All by Hiroshi Kato
TelemetryAPIでLambda関数の外側を覗く
kahiro
0
7
DurableExecutionを実装検証から理解する.pdf
kahiro
1
46
20260110_オンプレ思考からクラウドネイティブ思考への転換レシピ
kahiro
0
15
20251114_Amazon_Q_DeveloperでMCPを使う_最初の一歩__.pdf
kahiro
0
17
20250829_LambdaとStepFunctionsどちらを選ぶべき_コスト視点で考えてみる.pdf
kahiro
1
470
Step_Functions_をはじめよう_JSONataによる進化_.pdf
kahiro
2
160
20250706_AWSでランサムウェア対策_バックアップが最大の防御_.pdf
kahiro
0
400
20250701_VMwareワークロードのAWS移行を学ぶ.pdf
kahiro
0
150
20250412_JAWS-UG北陸新幹線.pdf
kahiro
0
130
Featured
See All Featured
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
580
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
sira's awesome portfolio website redesign presentation
elsirapls
0
280
エンジニアに許された特別な時間の終わり
watany
107
250k
Building Adaptive Systems
keathley
44
3k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
Rails Girls Zürich Keynote
gr2m
96
14k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.5k
Bash Introduction
62gerente
615
220k
Transcript
AIによるデザインレビュー 〜「画像の美しさ」をスコアに変換する〜 JAWS-UG名古屋 2026年3月18日(水)
自己紹介 加藤 寛士(かとう ひろし) • クラウドエンジニア • JAWS-UG 名古屋運営 @Hircha12
ちょっとした興味からはじめてみました • AIで「画像の美しさ」を採点できないか? • 一貫性のあるスコアを算定したい • 人による評価のバラつきをなくしたい
LLMに直接「採点して」と聞かない理由 出力:評価の言語化 課題:評価のブレ 出力:数値による採点 強み:常に一定の結果 再現性がある LLMに直接プロンプト 専用モデルでの算出
評価のブレを防ぐアプローチ CLIP(Contrastive Language–Image Pretraining) MLP(Multi Layer Perceptron) Aesthetic Predictor(CLIP+MLP) •
感覚的な「美しさ」を、数学的な「スコア」に変換する仕組み • OpenAIが作ったモデル(2021年) • 約4億枚の画像とテキストペアで学習済み • 画像を768次元の特徴ベクトルに変換する • 人間の評価データ(AVAデータセット)で学習された回帰モデル • CLIPの特徴から「人間なら何点をつけるか」を予測する
画像をスコアに変換するステップ CLIP MLP Embedding 画像を数値ベクトル に変換 数値ベクトルから 「美しさ」のスコア を計算 768次元
ベクトル Aesthetic スコア
AWS Serverlessによる構成 SageMaker Endpoint Model ECR S3 Client • aesthetic_model.pth(モデル)
• inference.py(推論実行ファイル) • Dockerイメージ(実行環境) POST スコア エンドポイント生成 モデル生成 CLIP MLP 768次元 ベクトル Aesthetic スコア Docker Container
APIを叩いてスコアを出してみる (.venv) xxxxx% aws sagemaker-runtime invoke-endpoint ¥ --endpoint-name aesthetic-endpoint ¥
--body fileb://payload2.json ¥ --content-type application/json ¥ --region us-east-1 ¥ /tmp/out.json && cat /tmp/out.json { "ContentType": "application/json", "InvokedProductionVariant": "variant-name-1" } {"score": 4.085611820220947}% • スコアは0〜10のスケール • 初回レスポンス:約2〜3秒(コールドスタート)
APIを叩いてスコアを出してみる 4.225589275360107 4.089179515838623 4.277888298034668 4.199540138244629
APIを叩いてスコアを出してみる 3.896981716156006 世界一ブサイクと認定された深海魚の画像
まとめ • CLIP(約4億枚学習済み)+ MLP で美しさを数値化 • LLMに直接聞くより、一貫性のある客観スコアが得られる • ECR +
SageMaker Serverless でインフラ管理なしにAPI化 • サーバーレスなので使った分だけ課金