Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Machine Learning As Software
Search
TajimaTheMemer
January 23, 2019
Programming
0
58
Machine Learning As Software
TajimaTheMemer
January 23, 2019
Tweet
Share
More Decks by TajimaTheMemer
See All by TajimaTheMemer
事業成長を加速させるGoのコード品質改善の取り組み / Code quality improvement for Go language
tajimathememer
5
2.1k
CronJobがschedule通りにJobを生成しない時
tajimathememer
0
1.1k
入門wasm
tajimathememer
0
75
ふわっと理解する類似画像検索技術
tajimathememer
0
130
Other Decks in Programming
See All in Programming
Flutterを言い訳にしない!アプリの使い心地改善テクニック5選🔥
kno3a87
1
200
Less waste, more joy, and a lot more green: How Quarkus makes Java better
hollycummins
0
100
ふかぼれ!CSSセレクターモジュール / Fukabore! CSS Selectors Module
petamoriken
0
150
CSC509 Lecture 13
javiergs
PRO
0
110
ActiveSupport::Notifications supporting instrumentation of Rails apps with OpenTelemetry
ymtdzzz
1
250
色々なIaCツールを実際に触って比較してみる
iriikeita
0
330
どうして僕の作ったクラスが手続き型と言われなきゃいけないんですか
akikogoto
1
120
TypeScriptでライブラリとの依存を限定的にする方法
tutinoko
3
700
Jakarta EE meets AI
ivargrimstad
0
160
AWS Lambdaから始まった Serverlessの「熱」とキャリアパス / It started with AWS Lambda Serverless “fever” and career path
seike460
PRO
1
260
2024/11/8 関西Kaggler会 2024 #3 / Kaggle Kernel で Gemma 2 × vLLM を動かす。
kohecchi
5
940
Nurturing OpenJDK distribution: Eclipse Temurin Success History and plan
ivargrimstad
0
990
Featured
See All Featured
StorybookのUI Testing Handbookを読んだ
zakiyama
27
5.3k
Building Applications with DynamoDB
mza
90
6.1k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
25
1.8k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.4k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
246
1.3M
Producing Creativity
orderedlist
PRO
341
39k
Practical Orchestrator
shlominoach
186
10k
Into the Great Unknown - MozCon
thekraken
32
1.5k
Being A Developer After 40
akosma
87
590k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Building an army of robots
kneath
302
43k
Transcript
Machine Learning As Software Makuake 社内 LT 2019/01/23 Tajima Taichi
今日話さないこと 機械学習の具体的な手法・アルゴリズムの説明 ※一般のソフトウェア開発者向けのお話です。
今日伝えたいこと 機械学習≠AI というよりも...
今日伝えたいこと 機械学習≒ソフトウェアの可能性を拡張する技術 と捉えるほうが適切という話(※私見)
機械学習とは データから目的の関数を生成する技術 ※全ての手法が、というわけではない。
例えば... AlphaGo(ゲームAI) 関数(機械学習モデル) 囲碁の盤面 最も勝率の高い 次の一手 シミュレータ環境上の打ち手データを使って...
例えば... Siri(音声認識) 関数(機械学習モデル) 音声波形 テキスト 音声とテキストのペアデータを使って...
例えば... Google翻訳(機械翻訳) 関数(機械学習モデル) 英語 日本語 日英の対訳データを使って...
例えば... Amazonの商品推薦(レコメンデーション) 関数(機械学習モデル) 行動、購買、 商品... ユーザーが 欲しがる商品 行動、購買、商品...データを使って...
近年、機械学習技術(特にDeep Learning)の進歩により 人手のコーディングでは表現が難しかった関数を データから生成することができるようになった
ソフトウェアとは 関数の集まり 機械学習とは データから目的の関数を生成する技術
機械学習≒ソフトウェアの可能性を拡張する技術
ここまでが今日伝えたかったこと
ここからは偉い人の話 (権威を笠に着る)
Software 2.0 Andrej Karpathy氏 (Director of AI at Tesla) によるエッセイ(2017年11月)
Software 1.0 人間がプログラミング言語で振る舞いを記述する 従来のソフトウェア開発 Software 2.0 ニューラルネット(Deep Learning)の重みパラメータで記述 される コーディングに人間が介在しない
なぜSoftware 2.0が重要か 現実世界の課題の大部分はプログラムを明示的に書くよりもデー タを収集するほうがずっと容易だから(ということらしい)
Software 2.0 例えば... 昔の Google翻訳は50万行のコードと多くのミドルウェア、 パイプラインなどで構成された大規模で複雑なソフトウェア (Software 1.0)
Software 2.0 現在の Google翻訳は500行のPythonコードとニューラル ネットの重みパラメータ(数百万)のファイルのみで構成され たソフトウェア(Software 2.0)
Software 2.0の良いところ① 均質な計算処理 Computationally homogeneous
Software 2.0の良いところ② チップに埋め込みやすい Simple to bake into silicon
Software 2.0の良いところ③ 実行時間が一定 Constant running time
Software 2.0の良いところ④ メモリ使用量も一定 Constant Memory Use
Software 2.0の良いところ⑤ 移植性が高い It is highly portable
Software 2.0の良いところ⑥ アジャイル It is very agile
Software 2.0の良いところ⑦ モジュール性 Modules can meld into an optimal whole
Software 2.0の良いところ⑧ お前らの書くコードより良い It is better than you
ただし、Software 2.0はSoftware1.0を 全て置き換えるものではない しかし、Software 2.0の適応範囲をますます広がっている
Software 2.0の記事から遡ること4ヶ月...
The future of deep learning Francois Chollet AI研究者, Keras(AIの民主化)の開発者 @Google
によるエッセイ(2017年7月)
The future of deep learning Software 2.0以降のソフトウェア開発の 具体的な素描 “Models As
Programs”
The future of deep learning Algorithmic subroutine: Software 1.0 Geometric
subroutine: Software 2.0 これからのソフトウェア開発
The future of deep learning もっと先の未来のソフトウェア開発 →自動化が進む
Machine Learning As Software時代の開発ツール Tensorflow Hub 学習済みの機械学習モデルのモジュールを共有するプラットフォーム Comet ML 機械学習モデルのバージョン管理・チーム開発ツール
Google Dataset Search データセット専用の検索エンジン
まとめ 機械学習という技術を適切に捉え、 適切に使っていきましょう。 (使わないという選択をする上でも大事。)