Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習の勉強で出会った印象的なワード
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
holywater044
October 29, 2020
Technology
1
38
機械学習の勉強で出会った印象的なワード
機械学習名古屋20200629登壇資料
https://machine-learning.connpass.com/event/178377/
holywater044
October 29, 2020
Tweet
Share
More Decks by holywater044
See All by holywater044
第4回Snowflake中部 User Group 〜DWの設計や運用、みんなどうしてるの? Snowflakeで迷うことディスカッション会~
holywater044
0
140
第3回 Snowflake 中部ユーザ会 - dbt x Snowflake ハンズオン - 状態イラスト抜粋版
holywater044
0
87
Tableau & Snowflake ハンズオン ~ データコラボレーションをぷち体験しよう ~
holywater044
1
310
Prepの集計機能についておさらいしてみる
holywater044
1
120
SageMakerDataWranglerでノンコードデータ前処理を試してみた
holywater044
0
49
時系列予測サービス Amazon Forecast の初学レポート
holywater044
0
36
Other Decks in Technology
See All in Technology
会社紹介資料 / Sansan Company Profile
sansan33
PRO
15
400k
Bill One急成長の舞台裏 開発組織が直面した失敗と教訓
sansantech
PRO
1
290
Webhook best practices for rock solid and resilient deployments
glaforge
1
260
OCI Database Management サービス詳細
oracle4engineer
PRO
1
7.3k
インフラエンジニア必見!Kubernetesを用いたクラウドネイティブ設計ポイント大全
daitak
0
320
Bill One 開発エンジニア 紹介資料
sansan33
PRO
4
17k
ClickHouseはどのように大規模データを活用したAIエージェントを全社展開しているのか
mikimatsumoto
0
190
変化するコーディングエージェントとの現実的な付き合い方 〜Cursor安定択説と、ツールに依存しない「資産」〜
empitsu
4
1.3k
サイボウズ 開発本部採用ピッチ / Cybozu Engineer Recruit
cybozuinsideout
PRO
10
73k
ZOZOにおけるAI活用の現在 ~開発組織全体での取り組みと試行錯誤~
zozotech
PRO
5
4.8k
予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善
muziyoshiz
1
1.6k
30万人の同時アクセスに耐えたい!新サービスの盤石なリリースを支える負荷試験 / SRE Kaigi 2026
genda
1
270
Featured
See All Featured
Thoughts on Productivity
jonyablonski
74
5k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
120
A better future with KSS
kneath
240
18k
Prompt Engineering for Job Search
mfonobong
0
160
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
150
So, you think you're a good person
axbom
PRO
2
1.9k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
320
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
200
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
0
250
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.4k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
110
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
290
Transcript
機械学習の勉強で出会った 印象的なワード 機械学習名古屋 第24回勉強会 2020-06-29 AKIHIRO HORIKAWA 1
自己紹介 名前: AKIHIRO HORIKAWA 所属: 総合エネルギー企業の技術研究所 仕事: データ分析(主にアセスメントとマネージメント) 資格: JDLA
G検定(2018#2)、他 コミュニティ: 機械学習名古屋、 中部Tableauユーザ会、 JAWS-UG名古屋、 他 趣味: 子供、データサイエンス勉強、ゲーム 課題: SNS 2
はじめに 3 ⚫ 機械学習を勉強しはじめて、かれこれ2年半くらいにな ります ⚫ その中で出会った印象的な言葉(用語? 格言? スラング?)を振り返ってみました ⚫
技術的な話は他の方達がやってくれると思うのでので、 息抜きでお付き合いください
4 『 前処理が8割 』
『前処理が8割』 ⚫ 意味 分析やモデリング以前に、生データをまともに分析できるようにす るまでが大変だよね。 ⚫ 出会い 忘れた(そこらじゅうで聞く) ⚫ 感想
• うなずくしかない • 後ろに「でもなかなかわかってもらえないんだよね」が付く • 「前処理」の指す範囲がはっきりしない データ確認、結合・整形、クリーニング、正規化・標準化、各種加工、 ホールドアウト、アノテーション、オーギュメンテーション、・・・。 EDA、特徴量設計は前処理に入るのかなぁ? 5
6 『 ラングリング 』
『ラングリング』 ⚫ 意味 「ラングリング」(wrangling)は、馬などを飼いならす、の意。 カウボーイ(wrangler)が暴れ馬を乗りこなすように、データを 自在に操るための収集・処理・分析・利用の総合テクニック。 参考:オライリー “Pythonではじめるデータラングリング” https://www.oreilly.co.jp/books/9784873117942/ ⚫
出会い 某AIベンチャーさんが使っていた ⚫ 感想 • 最初は、クレンジング・クリーニングのことかと思っていたたけど、 意味するところはもっと広く深い感じ • なんかカッコいい! 7
8 『 次元の呪い 』
『次元の呪い』 ⚫ 意味 • 特徴量の次元が大きいと、データ同士の超平面上の距離が同 じくらいに遠くなって、高精度のモデルが作れなくなること(?) • 次元が増えるほど、高い精度のモデルを作るために必要な訓練 データの量が爆発的に増えてしまうこと ⚫
出会い 渋谷駅前で働くデータサイエンティストさんのブログ https://tjo.hatenablog.com/entry/2013/10/22/193004 ⚫ 感想 • すみません、まだ腹に落とせてません・・・ • なんかカッコいい!(またか) 9
10 『 GIGO 』
『GIGO』 ⚫ 意味 “Garbage in, garbage out”の略。 意訳:ゴミデータからは、ゴミモデルしかできない。 ⚫ 出会い
MLSE経由でたどり着いた「仕事で始める機械学習」の有賀さん のスライド “機械学習プロジェクトアンチパータン?集” https://docs.google.com/presentation/d/192wLLgNzkbwuJ 8gLwu_SJMigwxg_EZrYeaK8vBoz3_I/edit#slide=id.p ⚫ 感想 • “データでプログラミングする”というMLの特性を顕した言葉1 • もらったデータから始めるしかないんで、いつも頭をよぎる 11
12 『 ノーフリーランチ 定理』
『ノーフリーランチ定理』 ⚫ 意味 「あらゆる問題を効率的に解決する解法」は理論上不可能で、 汎用的な最適解法というのは存在しない。 ⇒ DLがどんな問題にも正しいアプローチとは限らない ⚫ 出会い AINOWの記事
“ディープラーニングはすでに限界に達している のではないか?【後編】” https://ainow.ai/2019/02/19/162019/ ⚫ 感想 • 「タダ飯みたいなうまい話は無い」という例えが面白い • 元ネタがハインラインの『月は無慈悲な夜の女王』というのもイ カす(格言自体はもっと古くからあるらしい) 13
14 『 CACE 』
『CACE』 ⚫ 意味 “ChangeAnything ChangeEverything”の略。 何かが変わると全てが変わる、の意。 ⚫ 出会い 前出の有賀さんのスライド。 参考:Qiita“機械学習システムにおける「技術的負債」とその回避策”
https://qiita.com/fujit33/items/f58055667493ae79e2dd ⚫ 感想 • “データでプログラミングする”というMLの特性を顕した言葉その2 • いろいろ解釈できるけど、「学習データが少し変わっただけで~」、 「母集団の傾向が変わってしまい~」と理解 15
16 『 KISS 』
『KISS』 ⚫ 意味 愚直なまでにシンプルにせよ! 「Keep it simple stupid(単純かつ愚直であれ)」 「Keep it
simple, stupid(単純にしろ、この間抜け!)」 「Keep it short and simple(簡潔かつ単純であれ)」 ⚫ 出会い AINOWの記事 “データサイエンスはつまらない” https://ainow.ai/2019/10/14/179437/ ⚫ 感想 • いろいろ解釈できるけど、「複雑なアルゴリズム使えばいいわけ でない」、「特徴量加工もやりすぎはいけない」と理解 • 「設計思想のシンプルさ」みたいなのはすごく大事で、MLに限 らず真実だと思う 17
18 『 Human In The Loop 』
『Human In The Loop』 ⚫ 意味 MLなどによって自動化・自律化したシステムにおいて、一部の判 断や制御を人間が担うこと。 参考: https://japan.zdnet.com/article/35119800/
⚫ 出会い 1年くらい前、来栖川の偉い人にお聞きしたのが初耳。 ⚫ 感想 • 「人が入ることで、MLの不完全さ・不安定さを補う」、「データ蓄 積&アノテーションの壁を乗り越える道筋」と理解 • CDLE第2回勉強会で、ABEJA岡田社長も言及してた • 言葉としては、この後ちょっと流行して、わりとすぐ廃れちゃうん じゃないかという気がする 19
おわりに ⚫ このスライド書くために、evernoteに書き留めたものを 読み返していて、「ML勉強し始めて、わからないなりに いろいろ読み漁っていた頃」を思い出した ⚫ 最近そういうの薄くなってる気がするので、初心に帰って AINOWとかLeage.aiとかまた巡回しようと思った 20
21 ご清聴ありがとうございました。