Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
本当に簡単なkaggleの始め方 / Easy Way to Start Kaggle - s...
Search
yukinagae
February 19, 2019
Technology
610
2
Share
本当に簡単なkaggleの始め方 / Easy Way to Start Kaggle - short ver.
yukinagae
February 19, 2019
More Decks by yukinagae
See All by yukinagae
Devin, 正しい付き合い方と使い方 / Living and Working with Devin
yukinagae
3
1.4k
BerglasとCloud Buildを使って秘密情報をセキュアに(できるかも) / Berglas with Cloud Build
yukinagae
1
1.2k
ある機械学習システムをAWSからGCP/GKEに移行した話 / Machine Learning System Migration from AWS to GKE
yukinagae
8
4.3k
Python用のマイクロサービスフレームワークを探す旅 / A journey to find a microservices framework for Python
yukinagae
0
1.3k
AWSからGCP/GKEに移行してみた / From AWS to GKE on GCP
yukinagae
6
20k
Spotifyのレコメンドを理解する / Recommender Systems using Collaborative Filtering - Spotify
yukinagae
1
890
kintone事例紹介 JAMS.TV ケーススタディ / kintone-casestudy-jamstv
yukinagae
0
300
BigQuery MLの新機能紹介 Cloud Next '19 / BigQuery ML New Features Announced at Google Cloud Next 2019
yukinagae
2
17k
学習行動データ分析基盤 Learning Record Store(LRS)開発事例 / LRS case study
yukinagae
5
2.1k
Other Decks in Technology
See All in Technology
はじめてのDatadog
kairim0
0
170
情シスがMCP環境導入時に打ちのめされる認可の崖
oidfj
0
750
シンデレラなんかになりたくない!ガラスの靴が割れた時代にどう歩く?
nomizone
0
220
OpenClawとHermesAgentでAI新入社員を作った話
takanoriyanada
0
140
さきさん文庫の書籍ができるまで
sakiengineer
0
290
GitHub Copilot CLI の Rubber Duck 機能を使ってコーディングの品質をあげよう #techbaton_findy
stefafafan
2
1.2k
Dynamic Workersについて
yusukebe
1
210
Javaで学ぶSOLID原則
negima
1
220
AI駆動開発でなんでもハンズオン環境をつくってみた
yoshimi0227
0
160
Gradle×GitHub_ActionsでCI時間を約50%短縮 ジョブ分割の設計と落とし穴 / Cutting CI Time by ~50% with Gradle and GitHub Actions: Job-Splitting Design and Pitfalls
takatty
0
500
A Harness for Behaviour: how to get AI to generate code that does what we intend, or "TDD in the age of AI"
xpmatteo
0
490
権限管理設計を完全に理解した
rsugi
2
230
Featured
See All Featured
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.2k
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
Ethics towards AI in product and experience design
skipperchong
2
290
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
230
Context Engineering - Making Every Token Count
addyosmani
9
910
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.7k
sira's awesome portfolio website redesign presentation
elsirapls
0
260
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
150
Google's AI Overviews - The New Search
badams
0
1k
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
470
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Transcript
本当に簡単なkaggle の始め方 @yukinagae
自己紹介 永江悠紀 @yukinagae グロービス 2018/8 ~ データサイエンティスト(Python/Go) 経歴 元Java/Scala エンジニア
オーストラリアでデータ分析を勉強 → 今に至る 最近はベイズ統計モデリングに興味ある(˘ω˘) スヤァ
Agenda 1. kaggle とは? 2. kaggle の仕組み 3. やってみた( `・ω
・´) 3
1. kaggle とは? 4
世界最大の機械学習・データ分析の コンペを主催するプラットフォーム 5
つまり 6
データサイエンティストの 世界最強を決める大会 7
kaggle の規模 ユーザ数: 50 万以上 国: 190 カ国以上 らしい( `・ω
・´) 8
2. kaggle の仕組み 9
大まかな流れ 1. 主催者(企業など)がコンペを主催する a. データを準備 b. 問題を定義する 2. 参加者は様々な手法を使ってベストなモデルを構 築し、予測を提出する
スコアやランキングが分かる 3. 主催者は、精度が高い予測に賞金を払う 10
ということで 11
3. 早速kaggle をやってみた ( `・ω ・´) 12
1. コンペを選ぶ 13
例えばこのコンペ( `・ω ・´) 14
2. コンペの内容を読む 1. 概要: 大まかに把握 2. 評価指標: これが一番大事( `・ω ・´)
3. 賞金: できればほしいよね 4. 期限: 時間厳守 5. データ: だいたいCSV ファイル(BigQuery も) 15
3. 他の参加者から学ぶ 1. コード(kernel ) 2. ディスカッション(discussion ) 16
いろんな人がコードを載せてくれてるので助かる see: Simple Exploration+Baseline - GA Customer Revenue | Kaggle
17
4. 他の参加者の方法を真似てみる コードをパクってローカルPC で実行するだけの簡単 なお仕事( `・ω ・´) 18
5. 助け合う <= New! ちょうどライブラリのバージョンで上手く動作しなか ったので、上手くいった方法を教え合う( `・ω ・´) 19
6. めんどくさいので人のコードを fork する 20
fork したコードを実行するだけ( `・ω ・´) 21
実行中 22
7. 予測を提出する 23
8. スコアとランクを確認 689 位(全1,031 チーム) ちーん( `・ω ・´) 24
結局言いたいのは 25
パクった後が勝負 26
まとめ kaggle はデータサイエンティストのNo.1 を決める 大会 とりあえず人のコードをパクって頑張る kaggle は沼( `・ω ・´)
27
参考資料 Kaggle - Wikipedia What is Kaggle, Why I Participate,
What is the Impact? fast.ai · Making neural nets uncool again deeplearning.ai: Announcing new Deep Learning courses on Coursera 28
おわり( `・ω ・´) ようこそkaggle 沼へ 29
最後にいちおう We're hiring! 30