Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用
Search
Convergence Lab.
January 15, 2026
Research
0
160
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用
Convergence Lab.
January 15, 2026
Tweet
Share
More Decks by Convergence Lab.
See All by Convergence Lab.
RAGで制御可能なFull-duplex音声対話システム
mssmkmr
0
81
工学系の関数解析輪読会 - 第1章 線型空間
mssmkmr
0
130
NeurIPS2018読み会@PFN Dialog-to-Action: Conversational Question Answering Over a Large-Scale Knowledge Base
mssmkmr
0
2.1k
考える技術・書く技術まとめ
mssmkmr
0
730
Global-Locally Self-Attentive Dialogue State Tracker
mssmkmr
1
250
RNNとLSTM
mssmkmr
0
280
Other Decks in Research
See All in Research
Time to Cash: The Full Stack Breakdown of Modern ATM Attacks
ratatata
0
190
姫路市 -都市OSの「再実装」-
hopin
0
1.6k
Community Driveプロジェクト(CDPJ)の中間報告
smartfukushilab1
0
140
生成的情報検索時代におけるAI利用と認知バイアス
trycycle
PRO
0
200
教師あり学習と強化学習で作る 最強の数学特化LLM
analokmaus
2
850
Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning
satai
2
370
POI: Proof of Identity
katsyoshi
0
130
Akamaiのキャッシュ効率を支えるAdaptSizeについての論文を読んでみた
bootjp
1
410
Multi-Agent Large Language Models for Code Intelligence: Opportunities, Challenges, and Research Directions
fatemeh_fard
0
120
AIスーパーコンピュータにおけるLLM学習処理性能の計測と可観測性 / AI Supercomputer LLM Benchmarking and Observability
yuukit
1
540
Agentic AI フレームワーク戦略白書 (2025年度版)
mickey_kubo
1
110
[Devfest Incheon 2025] 모두를 위한 친절한 언어모델(LLM) 학습 가이드
beomi
2
1.4k
Featured
See All Featured
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
What's in a price? How to price your products and services
michaelherold
246
13k
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
41
[RailsConf 2023] Rails as a piece of cake
palkan
58
6.2k
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
75
Being A Developer After 40
akosma
91
590k
Un-Boring Meetings
codingconduct
0
180
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
410
Game over? The fight for quality and originality in the time of robots
wayneb77
1
84
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
196
71k
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
150
Writing Fast Ruby
sferik
630
62k
Transcript
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用 2026/01/15 Convergence Lab.株式会社 木村 優志 AI プロトコル勉強会No.2
自己紹介 木村 優志 Convergence Lab.株式会社代表取締役社長 音声言語処理や画像・自然言語処理の機械学習系 エンジニア 豊橋技術科学大学大学院博士後期課程単位取得後 退学。博士(工学)。ATR-Trec,富士通などを経て 現職。
スタートアップや大手ベンダの機械学習導入支援 を行っている。
CuteCatch ペットの可愛い瞬間を自動撮影するスマホアプ リ。 アプリ実装: Flutter 判定AIモデル: RepViTベース スマホデバイスで推論 学習画像は、StableDiffusion 2.1
で生成
ラベリングが大変 ⇨ 可愛い瞬間のラベリングが大変 ⇾ 1万6000枚の画像をラベリングしたところ で力尽きた。 ⇨ できればこの10倍はほしい ⇨ 予想だが、外注すると数十万円〜数百万円
かかる。
スマートラベリングの適用 ⇨ VLMを利用してラベリングを自動化する。 ⇨ Gemini 3.0 Flash Previewを利用した。 ⇨ 1万6000枚のラベリングにかかるコスト
⇾ 約1500円 ⇾ 6時間
精度比較 ラベリング手法 Accuracy (%) F1 (%) 人力ラベリング 78.9% 81.0% スマートラベリング
70.5% 76.4%
考察 ⇨ 精度は人力ラベリングのほうが高い。 ⇨ スマートラベリングは圧倒的に楽。 ⇨ テスト画像がそもそも人力分類なので、ス マートラベリングとの間にドメインシフトがあ る。 ⇨
画像の量を増やしていけば、差は埋まりそ う? ⇨ プロンプトの改善が必要。