Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用
Search
Convergence Lab.
January 15, 2026
Research
0
260
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用
Convergence Lab.
January 15, 2026
Tweet
Share
More Decks by Convergence Lab.
See All by Convergence Lab.
RAGで制御可能なFull-duplex音声対話システム
mssmkmr
0
88
工学系の関数解析輪読会 - 第1章 線型空間
mssmkmr
0
140
NeurIPS2018読み会@PFN Dialog-to-Action: Conversational Question Answering Over a Large-Scale Knowledge Base
mssmkmr
0
2.1k
考える技術・書く技術まとめ
mssmkmr
0
740
Global-Locally Self-Attentive Dialogue State Tracker
mssmkmr
1
260
RNNとLSTM
mssmkmr
0
290
Other Decks in Research
See All in Research
Mamba-in-Mamba: Centralized Mamba-Cross-Scan in Tokenized Mamba Model for Hyperspectral Image Classification
satai
3
590
競合や要望に流されない─B2B SaaSでミニマム要件を決めるリアルな取り組み / Don't be swayed by competitors or requests - A real effort to determine minimum requirements for B2B SaaS
kaminashi
0
720
教師あり学習と強化学習で作る 最強の数学特化LLM
analokmaus
2
890
【SIGGRAPH Asia 2025】Lo-Fi Photograph with Lo-Fi Communication
toremolo72
0
110
Aurora Serverless からAurora Serverless v2への課題と知見を論文から読み解く/Understanding the challenges and insights of moving from Aurora Serverless to Aurora Serverless v2 from a paper
bootjp
6
1.5k
A History of Approximate Nearest Neighbor Search from an Applications Perspective
matsui_528
1
160
視覚から身体性を持つAIへ: 巧緻な動作の3次元理解
tkhkaeio
0
190
姫路市 -都市OSの「再実装」-
hopin
0
1.6k
POI: Proof of Identity
katsyoshi
0
140
SREはサイバネティクスの夢をみるか? / Do SREs Dream of Cybernetics?
yuukit
3
380
Grounding Text Complexity Control in Defined Linguistic Difficulty [Keynote@*SEM2025]
yukiar
0
110
AIスパコン「さくらONE」の オブザーバビリティ / Observability for AI Supercomputer SAKURAONE
yuukit
2
1.2k
Featured
See All Featured
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
75
Chasing Engaging Ingredients in Design
codingconduct
0
110
The Spectacular Lies of Maps
axbom
PRO
1
520
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
1
100
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
0
440
sira's awesome portfolio website redesign presentation
elsirapls
0
150
Are puppies a ranking factor?
jonoalderson
1
2.7k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
330
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
120
Stop Working from a Prison Cell
hatefulcrawdad
273
21k
Transcript
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用 2026/01/15 Convergence Lab.株式会社 木村 優志 AI プロトコル勉強会No.2
自己紹介 木村 優志 Convergence Lab.株式会社代表取締役社長 音声言語処理や画像・自然言語処理の機械学習系 エンジニア 豊橋技術科学大学大学院博士後期課程単位取得後 退学。博士(工学)。ATR-Trec,富士通などを経て 現職。
スタートアップや大手ベンダの機械学習導入支援 を行っている。
CuteCatch ペットの可愛い瞬間を自動撮影するスマホアプ リ。 アプリ実装: Flutter 判定AIモデル: RepViTベース スマホデバイスで推論 学習画像は、StableDiffusion 2.1
で生成
ラベリングが大変 ⇨ 可愛い瞬間のラベリングが大変 ⇾ 1万6000枚の画像をラベリングしたところ で力尽きた。 ⇨ できればこの10倍はほしい ⇨ 予想だが、外注すると数十万円〜数百万円
かかる。
スマートラベリングの適用 ⇨ VLMを利用してラベリングを自動化する。 ⇨ Gemini 3.0 Flash Previewを利用した。 ⇨ 1万6000枚のラベリングにかかるコスト
⇾ 約1500円 ⇾ 6時間
精度比較 ラベリング手法 Accuracy (%) F1 (%) 人力ラベリング 78.9% 81.0% スマートラベリング
70.5% 76.4%
考察 ⇨ 精度は人力ラベリングのほうが高い。 ⇨ スマートラベリングは圧倒的に楽。 ⇨ テスト画像がそもそも人力分類なので、ス マートラベリングとの間にドメインシフトがあ る。 ⇨
画像の量を増やしていけば、差は埋まりそ う? ⇨ プロンプトの改善が必要。