Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20170216_TechKitchen_FoodImage_Classification
Search
yoppe
February 21, 2017
Technology
3
14k
20170216_TechKitchen_FoodImage_Classification
yoppe
February 21, 2017
Tweet
Share
More Decks by yoppe
See All by yoppe
20211023_recsys2021_paper_reading_YoheiKikuta
diracdiego
2
440
20201121_oldpaperreading_computing_machinery_and_intelligence
diracdiego
0
140
20200906_ACL2020_metric_for_ordinal_classification_YoheiKikuta
diracdiego
1
1.2k
20191102_ACL2019_adversarial_examples_in_NLP_YoheiKIKUTA
diracdiego
2
1.4k
20190223_nlpaperchallenge_CV_4.3to5.5
diracdiego
2
750
20180701_CVPR2018_reading_YoheiKIKUTA
diracdiego
3
1.1k
20180414_WSDM2018_reading_YoheiKIKUTA
diracdiego
0
680
20180306_NIPS2017_DeepLearning
diracdiego
4
5.8k
20180215_MLKitchen7_YoheiKIKUTA
diracdiego
0
360
Other Decks in Technology
See All in Technology
「自動テストのプラクティスを効果的に学ぶためのカードゲーム」 ( #sqip2024 )
teyamagu
PRO
2
180
アプリをリリースできる状態に保ったまま 段階的にリファクタリングするための 戦略と戦術 / Strategies and tactics for incremental refactoring
yanzm
6
1.4k
watsonx.ai Dojo 環境準備について
oniak3ibm
PRO
0
300
Mocking in Rust Applications
taiki45
1
410
o1のAPIで実験してみたが 制限きつすぎて辛かった話
pharma_x_tech
0
190
あなたの知らないiOS開発の世界
recruitengineers
PRO
3
180
Cloud Run と GitHub Template Repository による軽量なアプリケーションプラットフォーム/ #nikkei_tech_talk
nikkei_engineer_recruiting
0
100
プログラム検証入門
riru
6
870
四国のあのイベントの〇〇システムを45日間で構築した話 / cloudohenro2024_tachibana
biatunky
0
330
フルカイテン株式会社 採用資料
fullkaiten
0
32k
サーバレスでモバイルアプリ開発! NTTコム「ビジネスdアプリ」のアーキテクチャ / The architecture of business d app
nttcom
12
240
Functional TypeScript
naoya
11
4.8k
Featured
See All Featured
What the flash - Photography Introduction
edds
67
11k
The Language of Interfaces
destraynor
153
23k
KATA
mclloyd
27
13k
Unsuck your backbone
ammeep
667
57k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
27
7.4k
Large-scale JavaScript Application Architecture
addyosmani
508
110k
Building Flexible Design Systems
yeseniaperezcruz
325
38k
How GitHub (no longer) Works
holman
310
140k
What's new in Ruby 2.0
geeforr
340
31k
Atom: Resistance is Futile
akmur
261
25k
What's in a price? How to price your products and services
michaelherold
242
11k
Being A Developer After 40
akosma
84
590k
Transcript
Food Image Object Detection and Classification Challenges and Solutions
Part 2: classification
自己紹介 研究開発部 菊田遥平 好きな食べ物 ・焼き餃子 ・寿司 ・ハンバーグ 好きな確率分布 ・ポアソン分布
サービス紹介:料理きろく 41,000人以上のユーザー 850,000枚以上の料理写真 (20170207現在) ・Deep Learningを使った初プロダクト ・端末中の画像から料理画像を自動抽出 ・自分の料理の記録を一望できる ・201612に全体公開
アーキテクチャ(概略) Client API server DB 料理/非料理 判別 非同期な画像処理 Android, iOS
EC2 SQS S3 enqueue dequeue images results
料理/非料理 判別問題 赤ちゃんの画像はパブリックドメインの画像から取得 http://www.publicdomainpictures.net/
簡単な問題?
簡単な問題? 否! • 誤判別を引き起こしやすい画像の存在 → 画像は多様性が大きく判別が難しいものも多い • 適合率と再現率のバランス → サービス上の有用性と危険性を考慮する必要性がある
• 真のデータ分布にアクセス不可 → 規約上ユーザがアップした画像をチェックすることができない • 対象は動的に変化し続けるもの → ユーザが増えれば画像も増え、その傾向も変わっていくもの
最初のモデル AlexNet-like model • 迅速なサービスデプロイのために選択 → 研究開発部ができて間もない頃にプロジェクトがスタート • シンプルな料理/非料理判定モデル →
料理と非料理の2クラス分類として問題を定式化 • 適合率は悪くないが、再現率は良くない → 非料理を料理と判断される方が問題が多いためにこのように調整
間違えやすい画像の存在 非料理 ☓ 料理 ☓ AlexNet-like model
モデル改善のアプローチ • より高度なモデルを検証 → CNNの発展をキャッチアップして、その性能を検証 • 多クラス問題への拡張 → 間違えやすいクラスに対する明示的な対処として、クラスを追加 •
テストデータセットの拡充 → ローカル環境での性能判断を正確にするために、データを拡充 • 他のアプローチの併用 → 性能向上の可能性を追求するために、物体検出などの併用も模索 • ...
より高度なモデルを検証 様々なモデルを比較 • Network In Network • VGG19 • ResNet
• Inception v3 • ...
より高度なモデルを検証 • Network In Network : https://arxiv.org/abs/1312.4400 ・畳み込み層として多層パーセプトロンを採用 ・全結合層でなくglobal poolingを用いることで、少ないパラメタでロバストなモデルを実現
・精度は他のstate-of-the-artには劣るが、サイズが小さく優秀なモデルが作れる
より高度なモデルを検証 • VGG19 : https://arxiv.org/abs/1409.1556 ・基本的な要素で構成されたモデル ・単純ではあるが高い性能を発揮 ・モデルサイズは比較的大きい
より高度なモデルを検証 • ResNet : https://arxiv.org/abs/1512.03385 ・ネットワークのパスを分岐して、残差を学習するResidual unitを導入 ・誤差信号が2つのパスの組み合わせとなるため消失しづらく、深い構造を効率的に学習 ・高い精度を発揮(2015年のILSVRCで優勝)
より高度なモデルを検証 • Inception v3 : https://arxiv.org/abs/1512.00567 ・複数フィルタを並列に適用 異なるサイズとパターンを検出 ・高い精度を発揮 前身は2014年のILSVRCで優勝
・様々な亜種が提案 Inception-ResNet など
多クラス問題への拡張 food ≠ non-food • どちらも限られたデータから学習したもの → 全集合は扱えないため、非料理は非料理らしさをデータから学習 → 学習した非料理らしさに当てはまらないデータは予測が難しい
• 判定が微妙なもの適切なクラスに導きたい → 2値判別ではうまくいかなかったものを新しいクラスとして扱う • 間違えやすい赤ちゃんクラスなどを追加 → 試行錯誤の結果として発見した間違えやすいクラスを追加
多クラス問題への拡張 food ≠ non-food 確率密度 画像の種類 料理 非料理 非料理1 非料理2
料理 2クラスでは判定が難しい非料理画像を追加クラスでカバー
モデルの改善 料理 ◯ 非料理 ◯ Inception v3-like model + 多クラス学習
一番大事なことは継続 • トライ&エラーを繰り返し続ける • 発信し続ける • 状況の変化に適応し続ける柔軟性を持つ 様々なチャレンジを継続しています!
告知
AIチャレンジコンテスト • https://deepanalytics.jp/compe/31 • 先端的な人工知能技術開発を競う場 • 料理画像の画像認識アルゴリズムの作成 ILSVRCにもある物体検出と分類の2タスク クックパッドは料理画像データを提供 •
主催 人工知能技術戦略会議、内閣府、文科省
AIチャレンジコンテスト 締切 : 20170309 物体検出タスク - 20170208時点
AIチャレンジコンテスト 締切 : 20170309 分類タスク - 20170208時点
質問等ありましたら 下記までお問い合わせ下さい
[email protected]