Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ことのはの力で画像の異常検知 / Anomaly Detection by Language
Search
Henry Cui
September 30, 2023
Technology
680
0
Share
ことのはの力で画像の異常検知 / Anomaly Detection by Language
Henry Cui
September 30, 2023
More Decks by Henry Cui
See All by Henry Cui
プロダクション言語モデルの情報を盗む攻撃 / Stealing Part of a Production Language Model
zchenry
1
240
Direct Preference Optimization
zchenry
0
440
Diffusion Model with Perceptual Loss
zchenry
0
500
レンズの下のLLM / LLM under the Lens
zchenry
0
220
Go with the Prompt Flow
zchenry
0
200
Mojo Dojo
zchenry
0
250
驚愕の事実!LangChainが抱える問題 / Problems of LangChain
zchenry
0
300
MLOps初心者がMLflowを触る / MLflow Brief Introduction
zchenry
0
180
{{guidance}}のガイダンス / Guidance of guidance
zchenry
0
190
Other Decks in Technology
See All in Technology
20260323_データ分析基盤でGeminiを使う話
1210yuichi0
0
210
Bill One 開発エンジニア 紹介資料
sansan33
PRO
5
18k
OPENLOGI Company Profile for engineer
hr01
1
61k
Oracle Cloud Infrastructure:2026年3月度サービス・アップデート
oracle4engineer
PRO
0
220
CREがSLOを握ると 何が変わるのか
nekomaho
0
320
サイボウズ 開発本部採用ピッチ / Cybozu Engineer Recruit
cybozuinsideout
PRO
10
77k
ハーネスエンジニアリング×AI適応開発
aictokamiya
1
910
AIエージェント勉強会第3回 エージェンティックAIの時代がやってきた
ymiya55
0
180
遊びで始めたNew Relic MCP、気づいたらChatOpsなオブザーバビリティボットができてました/From New Relic MCP to a ChatOps Observability Bot
aeonpeople
1
130
会社紹介資料 / Sansan Company Profile
sansan33
PRO
16
410k
「活動」は激変する。「ベース」は変わらない ~ 4つの軸で捉える_AI時代ソフトウェア開発マネジメント
sentokun
0
140
やさしいとこから始めるGitHubリポジトリのセキュリティ
tsubakimoto_s
3
2.1k
Featured
See All Featured
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.3k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
2.6k
We Are The Robots
honzajavorek
0
210
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
8k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
920
Exploring anti-patterns in Rails
aemeredith
2
300
The SEO Collaboration Effect
kristinabergwall1
0
410
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
160
Skip the Path - Find Your Career Trail
mkilby
1
93
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
320
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
700
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
310
Transcript
ことのはの力で画像の異常検知 機械学習の社会実装勉強会第27回 Henry 2023/9/30
論文の紹介 ▪ 最近の基盤モデル(言語モデルと画像モデル)の発達により、その知識で 画像異常検知を行うモチベーション • まだ実用化まで距離あるが、技術的に面白い方法性 ▪ AnomalyGPT: Detecting Industrial
Anomalies using Large Vision-Language Models • https://github.com/CASIA-IVA-Lab/AnomalyGPT • 実装も公開されているのでありがたい 2
論文のモチベーション ▪ Vision付きLLM(MiniGPT-4やLLaVA)は一般物体について認 識できるが、ドメインごとの専門知識や局所の細部についての 知識がない ▪ 従来の異常検知手法は異常スコアを出せるが、人間が閾値を 設定する必要がある ▪ そこで、両者の良いところを結合したLarge
Vision-Language Model(LVLM)を用いた手法を提案 3
提案手法のイメージ 4
既存法との比較 ▪ 以下の側面で提案法は優れている • Few-shot learning:少量データで学習できる • Anomaly score:異常スコアを出力できる •
Anomaly localization:異常箇所を特定できる • Anomaly judegment:異常あり・無しを判断できる • Multi-turn dialogue:インタラクティブにやり取りできる 5
提案法の構成 6
Image Decoderの入力テキスト ▪ 前ページ構成図の上半分 ▪ テキストは以下のようなものを使う 7
学習データの準備 ▪ データ拡張に使われる技術で異常画像を生成する 8
学習データの準備 ▪ 学習用対話データは以下のように準備する 9
定量的な評価 ▪ 特に少数の学習データに強い 10
定性的な評価 11
定性的な評価 12
まとめ ▪ LVLM基盤モデルを用いた画像異常検知 • これからの発展が期待 13