Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習の勉強で出会った印象的なワード
Search
holywater044
October 29, 2020
Technology
1
29
機械学習の勉強で出会った印象的なワード
機械学習名古屋20200629登壇資料
https://machine-learning.connpass.com/event/178377/
holywater044
October 29, 2020
Tweet
Share
More Decks by holywater044
See All by holywater044
第4回Snowflake中部 User Group 〜DWの設計や運用、みんなどうしてるの? Snowflakeで迷うことディスカッション会~
holywater044
0
120
第3回 Snowflake 中部ユーザ会 - dbt x Snowflake ハンズオン - 状態イラスト抜粋版
holywater044
0
62
Tableau & Snowflake ハンズオン ~ データコラボレーションをぷち体験しよう ~
holywater044
1
250
Prepの集計機能についておさらいしてみる
holywater044
1
90
SageMakerDataWranglerでノンコードデータ前処理を試してみた
holywater044
0
42
時系列予測サービス Amazon Forecast の初学レポート
holywater044
0
31
Other Decks in Technology
See All in Technology
急成長を支える基盤作り〜地道な改善からコツコツと〜 #cre_meetup
stefafafan
0
130
BrainPadプログラミングコンテスト記念LT会2025_社内イベント&問題解説
brainpadpr
1
170
Navigation3でViewModelにデータを渡す方法
mikanichinose
0
220
Liquid Glass革新とSwiftUI/UIKit進化
fumiyasac0921
0
230
AWS アーキテクチャ作図入門/aws-architecture-diagram-101
ma2shita
30
11k
AWS Summit Japan 2025 Community Stage - App workflow automation by AWS Step Functions
matsuihidetoshi
1
280
Observability infrastructure behind the trillion-messages scale Kafka platform
lycorptech_jp
PRO
0
140
Claude Code Actionを使ったコード品質改善の取り組み
potix2
PRO
6
2.4k
あなたの声を届けよう! 女性エンジニア登壇の意義とアウトプット実践ガイド #wttjp / Call for Your Voice
kondoyuko
4
470
Amazon ECS & AWS Fargate 運用アーキテクチャ2025 / Amazon ECS and AWS Fargate Ops Architecture 2025
iselegant
17
5.7k
エンジニア向け技術スタック情報
kauche
1
270
PostgreSQL 18 cancel request key長の変更とRailsへの関連
yahonda
0
120
Featured
See All Featured
For a Future-Friendly Web
brad_frost
179
9.8k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
What's in a price? How to price your products and services
michaelherold
246
12k
The Language of Interfaces
destraynor
158
25k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
5.9k
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3.3k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
48
5.4k
Intergalactic Javascript Robots from Outer Space
tanoku
271
27k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.3k
Designing for Performance
lara
609
69k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Transcript
機械学習の勉強で出会った 印象的なワード 機械学習名古屋 第24回勉強会 2020-06-29 AKIHIRO HORIKAWA 1
自己紹介 名前: AKIHIRO HORIKAWA 所属: 総合エネルギー企業の技術研究所 仕事: データ分析(主にアセスメントとマネージメント) 資格: JDLA
G検定(2018#2)、他 コミュニティ: 機械学習名古屋、 中部Tableauユーザ会、 JAWS-UG名古屋、 他 趣味: 子供、データサイエンス勉強、ゲーム 課題: SNS 2
はじめに 3 ⚫ 機械学習を勉強しはじめて、かれこれ2年半くらいにな ります ⚫ その中で出会った印象的な言葉(用語? 格言? スラング?)を振り返ってみました ⚫
技術的な話は他の方達がやってくれると思うのでので、 息抜きでお付き合いください
4 『 前処理が8割 』
『前処理が8割』 ⚫ 意味 分析やモデリング以前に、生データをまともに分析できるようにす るまでが大変だよね。 ⚫ 出会い 忘れた(そこらじゅうで聞く) ⚫ 感想
• うなずくしかない • 後ろに「でもなかなかわかってもらえないんだよね」が付く • 「前処理」の指す範囲がはっきりしない データ確認、結合・整形、クリーニング、正規化・標準化、各種加工、 ホールドアウト、アノテーション、オーギュメンテーション、・・・。 EDA、特徴量設計は前処理に入るのかなぁ? 5
6 『 ラングリング 』
『ラングリング』 ⚫ 意味 「ラングリング」(wrangling)は、馬などを飼いならす、の意。 カウボーイ(wrangler)が暴れ馬を乗りこなすように、データを 自在に操るための収集・処理・分析・利用の総合テクニック。 参考:オライリー “Pythonではじめるデータラングリング” https://www.oreilly.co.jp/books/9784873117942/ ⚫
出会い 某AIベンチャーさんが使っていた ⚫ 感想 • 最初は、クレンジング・クリーニングのことかと思っていたたけど、 意味するところはもっと広く深い感じ • なんかカッコいい! 7
8 『 次元の呪い 』
『次元の呪い』 ⚫ 意味 • 特徴量の次元が大きいと、データ同士の超平面上の距離が同 じくらいに遠くなって、高精度のモデルが作れなくなること(?) • 次元が増えるほど、高い精度のモデルを作るために必要な訓練 データの量が爆発的に増えてしまうこと ⚫
出会い 渋谷駅前で働くデータサイエンティストさんのブログ https://tjo.hatenablog.com/entry/2013/10/22/193004 ⚫ 感想 • すみません、まだ腹に落とせてません・・・ • なんかカッコいい!(またか) 9
10 『 GIGO 』
『GIGO』 ⚫ 意味 “Garbage in, garbage out”の略。 意訳:ゴミデータからは、ゴミモデルしかできない。 ⚫ 出会い
MLSE経由でたどり着いた「仕事で始める機械学習」の有賀さん のスライド “機械学習プロジェクトアンチパータン?集” https://docs.google.com/presentation/d/192wLLgNzkbwuJ 8gLwu_SJMigwxg_EZrYeaK8vBoz3_I/edit#slide=id.p ⚫ 感想 • “データでプログラミングする”というMLの特性を顕した言葉1 • もらったデータから始めるしかないんで、いつも頭をよぎる 11
12 『 ノーフリーランチ 定理』
『ノーフリーランチ定理』 ⚫ 意味 「あらゆる問題を効率的に解決する解法」は理論上不可能で、 汎用的な最適解法というのは存在しない。 ⇒ DLがどんな問題にも正しいアプローチとは限らない ⚫ 出会い AINOWの記事
“ディープラーニングはすでに限界に達している のではないか?【後編】” https://ainow.ai/2019/02/19/162019/ ⚫ 感想 • 「タダ飯みたいなうまい話は無い」という例えが面白い • 元ネタがハインラインの『月は無慈悲な夜の女王』というのもイ カす(格言自体はもっと古くからあるらしい) 13
14 『 CACE 』
『CACE』 ⚫ 意味 “ChangeAnything ChangeEverything”の略。 何かが変わると全てが変わる、の意。 ⚫ 出会い 前出の有賀さんのスライド。 参考:Qiita“機械学習システムにおける「技術的負債」とその回避策”
https://qiita.com/fujit33/items/f58055667493ae79e2dd ⚫ 感想 • “データでプログラミングする”というMLの特性を顕した言葉その2 • いろいろ解釈できるけど、「学習データが少し変わっただけで~」、 「母集団の傾向が変わってしまい~」と理解 15
16 『 KISS 』
『KISS』 ⚫ 意味 愚直なまでにシンプルにせよ! 「Keep it simple stupid(単純かつ愚直であれ)」 「Keep it
simple, stupid(単純にしろ、この間抜け!)」 「Keep it short and simple(簡潔かつ単純であれ)」 ⚫ 出会い AINOWの記事 “データサイエンスはつまらない” https://ainow.ai/2019/10/14/179437/ ⚫ 感想 • いろいろ解釈できるけど、「複雑なアルゴリズム使えばいいわけ でない」、「特徴量加工もやりすぎはいけない」と理解 • 「設計思想のシンプルさ」みたいなのはすごく大事で、MLに限 らず真実だと思う 17
18 『 Human In The Loop 』
『Human In The Loop』 ⚫ 意味 MLなどによって自動化・自律化したシステムにおいて、一部の判 断や制御を人間が担うこと。 参考: https://japan.zdnet.com/article/35119800/
⚫ 出会い 1年くらい前、来栖川の偉い人にお聞きしたのが初耳。 ⚫ 感想 • 「人が入ることで、MLの不完全さ・不安定さを補う」、「データ蓄 積&アノテーションの壁を乗り越える道筋」と理解 • CDLE第2回勉強会で、ABEJA岡田社長も言及してた • 言葉としては、この後ちょっと流行して、わりとすぐ廃れちゃうん じゃないかという気がする 19
おわりに ⚫ このスライド書くために、evernoteに書き留めたものを 読み返していて、「ML勉強し始めて、わからないなりに いろいろ読み漁っていた頃」を思い出した ⚫ 最近そういうの薄くなってる気がするので、初心に帰って AINOWとかLeage.aiとかまた巡回しようと思った 20
21 ご清聴ありがとうございました。