Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用
Search
Convergence Lab.
January 15, 2026
Research
0
340
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用
Convergence Lab.
January 15, 2026
Tweet
Share
More Decks by Convergence Lab.
See All by Convergence Lab.
RAGで制御可能なFull-duplex音声対話システム
mssmkmr
0
94
工学系の関数解析輪読会 - 第1章 線型空間
mssmkmr
0
140
NeurIPS2018読み会@PFN Dialog-to-Action: Conversational Question Answering Over a Large-Scale Knowledge Base
mssmkmr
0
2.1k
考える技術・書く技術まとめ
mssmkmr
0
760
Global-Locally Self-Attentive Dialogue State Tracker
mssmkmr
1
270
RNNとLSTM
mssmkmr
0
290
Other Decks in Research
See All in Research
IEEE AIxVR 2026 Keynote Talk: "Beyond Visibility: Understanding Scenes and Humans under Challenging Conditions with Diverse Sensing"
miso2024
0
110
[Devfest Incheon 2025] 모두를 위한 친절한 언어모델(LLM) 학습 가이드
beomi
2
1.5k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
1
140
財務諸表監査のための逐次検定
masakat0
1
270
LLMアプリケーションの透明性について
fufufukakaka
0
180
Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora (AAAI 2026 bridge keynote)
morishtr
1
150
SREのためのテレメトリー技術の探究 / Telemetry for SRE
yuukit
13
3.2k
An Open and Reproducible Deep Research Agent for Long-Form Question Answering
ikuyamada
0
330
Satellites Reveal Mobility: A Commuting Origin-destination Flow Generator for Global Cities
satai
3
570
ウェブ・ソーシャルメディア論文読み会 第36回: The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents (EMNLP, 2025)
hkefka385
0
200
2026-01-30-MandSL-textbook-jp-cos-lod
yegusa
1
490
"主観で終わらせない"定性データ活用 ― プロダクトディスカバリーを加速させるインサイトマネジメント / Utilizing qualitative data that "doesn't end with subjectivity" - Insight management that accelerates product discovery
kaminashi
16
22k
Featured
See All Featured
SEO for Brand Visibility & Recognition
aleyda
0
4.3k
Site-Speed That Sticks
csswizardry
13
1.1k
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
280
It's Worth the Effort
3n
188
29k
A better future with KSS
kneath
240
18k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.1k
A Soul's Torment
seathinner
5
2.4k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
180
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.1k
Utilizing Notion as your number one productivity tool
mfonobong
4
240
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
0
2.4k
Transcript
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用 2026/01/15 Convergence Lab.株式会社 木村 優志 AI プロトコル勉強会No.2
自己紹介 木村 優志 Convergence Lab.株式会社代表取締役社長 音声言語処理や画像・自然言語処理の機械学習系 エンジニア 豊橋技術科学大学大学院博士後期課程単位取得後 退学。博士(工学)。ATR-Trec,富士通などを経て 現職。
スタートアップや大手ベンダの機械学習導入支援 を行っている。
CuteCatch ペットの可愛い瞬間を自動撮影するスマホアプ リ。 アプリ実装: Flutter 判定AIモデル: RepViTベース スマホデバイスで推論 学習画像は、StableDiffusion 2.1
で生成
ラベリングが大変 ⇨ 可愛い瞬間のラベリングが大変 ⇾ 1万6000枚の画像をラベリングしたところ で力尽きた。 ⇨ できればこの10倍はほしい ⇨ 予想だが、外注すると数十万円〜数百万円
かかる。
スマートラベリングの適用 ⇨ VLMを利用してラベリングを自動化する。 ⇨ Gemini 3.0 Flash Previewを利用した。 ⇨ 1万6000枚のラベリングにかかるコスト
⇾ 約1500円 ⇾ 6時間
精度比較 ラベリング手法 Accuracy (%) F1 (%) 人力ラベリング 78.9% 81.0% スマートラベリング
70.5% 76.4%
考察 ⇨ 精度は人力ラベリングのほうが高い。 ⇨ スマートラベリングは圧倒的に楽。 ⇨ テスト画像がそもそも人力分類なので、ス マートラベリングとの間にドメインシフトがあ る。 ⇨
画像の量を増やしていけば、差は埋まりそ う? ⇨ プロンプトの改善が必要。