Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用
Search
Convergence Lab.
January 15, 2026
Research
0
390
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用
Convergence Lab.
January 15, 2026
Tweet
Share
More Decks by Convergence Lab.
See All by Convergence Lab.
RAGで制御可能なFull-duplex音声対話システム
mssmkmr
0
98
工学系の関数解析輪読会 - 第1章 線型空間
mssmkmr
0
140
NeurIPS2018読み会@PFN Dialog-to-Action: Conversational Question Answering Over a Large-Scale Knowledge Base
mssmkmr
0
2.1k
考える技術・書く技術まとめ
mssmkmr
0
780
Global-Locally Self-Attentive Dialogue State Tracker
mssmkmr
1
270
RNNとLSTM
mssmkmr
0
290
Other Decks in Research
See All in Research
討議:RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
0
620
Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora (AAAI 2026 bridge keynote)
morishtr
1
170
Φ-Sat-2のAutoEncoderによる情報圧縮系論文
satai
3
160
Collective Predictive Coding and World Models in LLMs: A System 0/1/2/3 Perspective on Hierarchical Physical AI (IEEE SII 2026 Plenary Talk)
tanichu
1
310
社内データ分析AIエージェントを できるだけ使いやすくする工夫
fufufukakaka
1
970
一般道の交通量減少と速度低下についての全国分析と熊本市におけるケーススタディ(20251122 土木計画学研究発表会)
trafficbrain
0
180
2026-01-30-MandSL-textbook-jp-cos-lod
yegusa
1
720
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
180
[IBIS 2025] 深層基盤モデルのための強化学習驚きから理論にもとづく納得へ
akifumi_wachi
20
9.8k
2026年1月の生成AI領域の重要リリース&トピック解説
kajikent
0
850
通時的な類似度行列に基づく単語の意味変化の分析
rudorudo11
0
200
2026年3月1日(日)福島「除染土」の公共利用をかんがえる
atsukomasano2026
0
460
Featured
See All Featured
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
780
Tell your own story through comics
letsgokoyo
1
850
Statistics for Hackers
jakevdp
799
230k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
340
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
2.5k
GraphQLの誤解/rethinking-graphql
sonatard
75
11k
Skip the Path - Find Your Career Trail
mkilby
1
87
The Cost Of JavaScript in 2023
addyosmani
55
9.8k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
190
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
230
Transcript
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用 2026/01/15 Convergence Lab.株式会社 木村 優志 AI プロトコル勉強会No.2
自己紹介 木村 優志 Convergence Lab.株式会社代表取締役社長 音声言語処理や画像・自然言語処理の機械学習系 エンジニア 豊橋技術科学大学大学院博士後期課程単位取得後 退学。博士(工学)。ATR-Trec,富士通などを経て 現職。
スタートアップや大手ベンダの機械学習導入支援 を行っている。
CuteCatch ペットの可愛い瞬間を自動撮影するスマホアプ リ。 アプリ実装: Flutter 判定AIモデル: RepViTベース スマホデバイスで推論 学習画像は、StableDiffusion 2.1
で生成
ラベリングが大変 ⇨ 可愛い瞬間のラベリングが大変 ⇾ 1万6000枚の画像をラベリングしたところ で力尽きた。 ⇨ できればこの10倍はほしい ⇨ 予想だが、外注すると数十万円〜数百万円
かかる。
スマートラベリングの適用 ⇨ VLMを利用してラベリングを自動化する。 ⇨ Gemini 3.0 Flash Previewを利用した。 ⇨ 1万6000枚のラベリングにかかるコスト
⇾ 約1500円 ⇾ 6時間
精度比較 ラベリング手法 Accuracy (%) F1 (%) 人力ラベリング 78.9% 81.0% スマートラベリング
70.5% 76.4%
考察 ⇨ 精度は人力ラベリングのほうが高い。 ⇨ スマートラベリングは圧倒的に楽。 ⇨ テスト画像がそもそも人力分類なので、ス マートラベリングとの間にドメインシフトがあ る。 ⇨
画像の量を増やしていけば、差は埋まりそ う? ⇨ プロンプトの改善が必要。