Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ライセンスの呪いを祓う
Search
Henry Cui
December 31, 2022
Technology
700
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
ライセンスの呪いを祓う
Henry Cui
December 31, 2022
More Decks by Henry Cui
See All by Henry Cui
プロダクション言語モデルの情報を盗む攻撃 / Stealing Part of a Production Language Model
zchenry
1
250
Direct Preference Optimization
zchenry
0
460
Diffusion Model with Perceptual Loss
zchenry
0
520
レンズの下のLLM / LLM under the Lens
zchenry
0
230
Go with the Prompt Flow
zchenry
0
230
Mojo Dojo
zchenry
0
270
ことのはの力で画像の異常検知 / Anomaly Detection by Language
zchenry
0
720
驚愕の事実!LangChainが抱える問題 / Problems of LangChain
zchenry
0
320
MLOps初心者がMLflowを触る / MLflow Brief Introduction
zchenry
0
210
Other Decks in Technology
See All in Technology
そのPoC、何を検証したつもりでしたか? AIプロダクトの価値検証で陥った落とし穴
techtekt
PRO
0
150
Agentic ERPをどう設計するか ー 受発注エージェントを動かす、現場の知見と設計思想ー
recerqainc
1
1.6k
ChatworkとBPaaS 異なる特性で学んだAI機能開発の ベストプラクティス
kubell_hr
2
2.8k
新規ゲーム開発におけるAI駆動開発のリアル
202409e2
0
2.6k
【Gen-AX】20260530開催_JJUG CCC 2026 Spring
genax
0
420
AI Adaptable なテストを整える工夫 / Ways to Make Your Tests AI-Adaptable
bitkey
PRO
3
220
Claude Codeを組織で使いこなす— サーバサイドAIエージェント運用の実践知
techtekt
PRO
0
200
美味しいスイスチーズを作ろう🧀🐭
taigamikami
1
240
AIにフローを作らせようとして挫折した話
hamatsutaichi
0
200
サイバーセキュリティ概論 / Introduction to Cybersecurity
ks91
PRO
0
160
PHP と TypeScript の型システム比較:AI 時代の「型」は誰のためにあるのか? #frontend_phpcon_do / frontend_phpcon_do_2026
shogogg
1
250
もりもり新機能を一挙紹介! AgentCoreに入門して、AWS上にAIエージェントを構築しよう
minorun365
PRO
6
820
Featured
See All Featured
The agentic SEO stack - context over prompts
schlessera
0
790
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.5k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
1.1k
The Limits of Empathy - UXLibs8
cassininazir
1
350
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
410
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
480
YesSQL, Process and Tooling at Scale
rocio
174
15k
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
2
570
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.7k
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
140
Building an army of robots
kneath
306
46k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Transcript
ライセンスの呪いを祓う 機械学習の社会実装勉強会第18回 Henry 2022/12/31
ライセンス! ▪ このライブラリー・この実装を使いたい! → ライセンスを見てみたら、だめでした。。。 ▪ 色々回避策を施し、やっとリリースできる → と思いきや、pre-trained modelをfine
tuningしていた ▪ ほとんどのpre-trained modelはImageNetで学習していた • ImageNetやPlaces365自体は商用不可 • 学習済みモデルの重みという数値の塊は、ImageNetと違うけど、商用 不可と承認したうえでデータをダウンロードし学習を回すので、やはり 学習済みモデルも商用不可なのでは → そもそも最初でImageNetでpre-trainしなければ厄介なことにならな い → ImageNet以外のpre-training data候補として、人工生成画像が有 望! 2
Pre-training without Natural Images ▪ ACCV 2020, IJCV 2022 ▪
数学的に大量な画像を生成したい • Fractalは有名な数学的構造 • シンプルなパラメータで複雑な模様を制御できる ▪ Iterated Function System (IFS)で生成プロセスを定義 • • 一つのIFSを一つの分類カテゴリにする • 確率pでiを決める • 以下の式でxを変換 3
Pre-training without Natural Images ▪ Downstream taskにおいて、scratchを遥かに超える収束速 度を達成 4
実験結果 ▪ 基本的にデータ数(カテゴリ数または各カテゴリの画像数)は 多いほうが性能が良い ▪ ResNet-50という小さめのモデルを使ったので、キャパシティ のより大きいモデルで更に精度向上の可能性 5
実験結果 ▪ ImageNetと拮抗するぐらいの性能 ▪ 人工データに数の上限がないので、モデルのキャパシティを 上げることで性能向上の可能性 6
Can Vision Transformers Learn without Natural Images? ▪ AAAI 2022
▪ 前述の生成過程を少し拡張し、Vision Transformersに適用し た ▪ より性能の良いpre-trainが達成できた 7
Replacing Labeled Real-Image Datasets with Auto-Generated Contours ▪ CVPR 2022
▪ 生成プロセスがより精緻化になったContourベースの人工 データで、Vision Transformersのpre-trainで(限定的ですが) ImageNetを超えた 8
Replacing Labeled Real-Image Datasets with Auto-Generated Contours ▪ Vision TransformerのAttention
Mapで、Fractalsにとって縁 のところが注目される → Contourで良い ▪ 自由度が高い人工データのほうが性能が良い → 生成プロセ スにある可動パラメータを増やせば良い 9
まとめ ▪ ライセンス問題回避のために、人工生成画像で画像認識モデ ルをpre-trainする手法に関する論文 • Vision Transformersで優れた性能が実現 ▪ Future work
• ほとんど白黒の画像を扱ってきたが、カラフルな生成画像でpre-train すればよりパワフルになる! 10