Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Convergence Lab.
January 15, 2026
Research
0
340
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用
Convergence Lab.
January 15, 2026
Tweet
Share
More Decks by Convergence Lab.
See All by Convergence Lab.
RAGで制御可能なFull-duplex音声対話システム
mssmkmr
0
94
工学系の関数解析輪読会 - 第1章 線型空間
mssmkmr
0
140
NeurIPS2018読み会@PFN Dialog-to-Action: Conversational Question Answering Over a Large-Scale Knowledge Base
mssmkmr
0
2.1k
考える技術・書く技術まとめ
mssmkmr
0
760
Global-Locally Self-Attentive Dialogue State Tracker
mssmkmr
1
270
RNNとLSTM
mssmkmr
0
290
Other Decks in Research
See All in Research
「車1割削減、渋滞半減、公共交通2倍」を 熊本から岡山へ@RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
1
680
世界モデルにおける分布外データ対応の方法論
koukyo1994
7
1.8k
【NICOGRAPH2025】Photographic Conviviality: ボディペイント・ワークショップによる 同時的かつ共生的な写真体験
toremolo72
0
180
ForestCast: Forecasting Deforestation Risk at Scale with Deep Learning
satai
3
460
地域丸ごとデイサービス「Go トレ」の紹介
smartfukushilab1
0
1k
LLMアプリケーションの透明性について
fufufukakaka
0
180
2026-01-30-MandSL-textbook-jp-cos-lod
yegusa
1
490
ブレグマン距離最小化に基づくリース表現量推定:バイアス除去学習の統一理論
masakat0
0
170
An Open and Reproducible Deep Research Agent for Long-Form Question Answering
ikuyamada
0
330
SkySense V2: A Unified Foundation Model for Multi-modal Remote Sensing
satai
3
560
討議:RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
0
520
Collective Predictive Coding and World Models in LLMs: A System 0/1/2/3 Perspective on Hierarchical Physical AI (IEEE SII 2026 Plenary Talk)
tanichu
1
270
Featured
See All Featured
Into the Great Unknown - MozCon
thekraken
40
2.3k
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
310
Game over? The fight for quality and originality in the time of robots
wayneb77
1
130
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
WENDY [Excerpt]
tessaabrams
9
36k
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
80
Paper Plane
katiecoart
PRO
0
47k
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
170
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.4k
The untapped power of vector embeddings
frankvandijk
2
1.6k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Six Lessons from altMBA
skipperchong
29
4.2k
Transcript
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用 2026/01/15 Convergence Lab.株式会社 木村 優志 AI プロトコル勉強会No.2
自己紹介 木村 優志 Convergence Lab.株式会社代表取締役社長 音声言語処理や画像・自然言語処理の機械学習系 エンジニア 豊橋技術科学大学大学院博士後期課程単位取得後 退学。博士(工学)。ATR-Trec,富士通などを経て 現職。
スタートアップや大手ベンダの機械学習導入支援 を行っている。
CuteCatch ペットの可愛い瞬間を自動撮影するスマホアプ リ。 アプリ実装: Flutter 判定AIモデル: RepViTベース スマホデバイスで推論 学習画像は、StableDiffusion 2.1
で生成
ラベリングが大変 ⇨ 可愛い瞬間のラベリングが大変 ⇾ 1万6000枚の画像をラベリングしたところ で力尽きた。 ⇨ できればこの10倍はほしい ⇨ 予想だが、外注すると数十万円〜数百万円
かかる。
スマートラベリングの適用 ⇨ VLMを利用してラベリングを自動化する。 ⇨ Gemini 3.0 Flash Previewを利用した。 ⇨ 1万6000枚のラベリングにかかるコスト
⇾ 約1500円 ⇾ 6時間
精度比較 ラベリング手法 Accuracy (%) F1 (%) 人力ラベリング 78.9% 81.0% スマートラベリング
70.5% 76.4%
考察 ⇨ 精度は人力ラベリングのほうが高い。 ⇨ スマートラベリングは圧倒的に楽。 ⇨ テスト画像がそもそも人力分類なので、ス マートラベリングとの間にドメインシフトがあ る。 ⇨
画像の量を増やしていけば、差は埋まりそ う? ⇨ プロンプトの改善が必要。