Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
本当に簡単なkaggleの始め方 / Easy Way to Start Kaggle - s...
Search
yukinagae
February 19, 2019
Technology
2
510
本当に簡単なkaggleの始め方 / Easy Way to Start Kaggle - short ver.
yukinagae
February 19, 2019
Tweet
Share
More Decks by yukinagae
See All by yukinagae
Devin , 正しい付き合い方と使い方 / Living and Working with Devin
yukinagae
1
510
BerglasとCloud Buildを使って秘密情報をセキュアに(できるかも) / Berglas with Cloud Build
yukinagae
1
1.1k
ある機械学習システムをAWSからGCP/GKEに移行した話 / Machine Learning System Migration from AWS to GKE
yukinagae
8
3.9k
Python用のマイクロサービスフレームワークを探す旅 / A journey to find a microservices framework for Python
yukinagae
0
1.1k
AWSからGCP/GKEに移行してみた / From AWS to GKE on GCP
yukinagae
6
8.8k
Spotifyのレコメンドを理解する / Recommender Systems using Collaborative Filtering - Spotify
yukinagae
1
640
kintone事例紹介 JAMS.TV ケーススタディ / kintone-casestudy-jamstv
yukinagae
0
220
BigQuery MLの新機能紹介 Cloud Next '19 / BigQuery ML New Features Announced at Google Cloud Next 2019
yukinagae
2
16k
学習行動データ分析基盤 Learning Record Store(LRS)開発事例 / LRS case study
yukinagae
5
1.9k
Other Decks in Technology
See All in Technology
パスキーでのログインを 実装してみよう!
hibiki_cube
0
580
LINEギフトのLINEミニアプリアクセシビリティ改善事例
lycorptech_jp
PRO
0
210
Restarting_SRE_Road_to_SRENext_.pdf
_awache
0
140
Road to SRE NEXT@仙台 IVRyの組織の形とSLO運用の現状
abnoumaru
0
370
Amazon EKS Auto ModeでKubernetesの運用をシンプルにする
sshota0809
0
110
ドメインイベントを活用したPHPコードのリファクタリング
kajitack
2
1.1k
頻繁リリース × 高品質 = 無理ゲー? いや、できます!/20250306 Shoki Hyo
shift_evolve
0
150
新卒エンジニア研修の試行錯誤と工夫/nikkei-tech-talk-31
nishiuma
0
180
ソフトウェア開発におけるインターフェイスという考え方 / PHPerKaigi 2025
k1low
9
3.9k
PHPStan をできる限り高速化してみる
colopl
0
250
ソフトウェア開発現代史: なぜ日本のソフトウェア開発は「滝」なのか?製造業の成功体験とのギャップ #jassttokyo
takabow
2
1.4k
DevinはクラウドエンジニアAIになれるのか!? 実践的なガードレール設計/devin-can-become-a-cloud-engineer-ai-practical-guardrail-design
tomoki10
3
1.2k
Featured
See All Featured
YesSQL, Process and Tooling at Scale
rocio
172
14k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
It's Worth the Effort
3n
184
28k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
46
2.4k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
45
9.5k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
30
1.1k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
8
700
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.8k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
15
1.1k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
7
610
Transcript
本当に簡単なkaggle の始め方 @yukinagae
自己紹介 永江悠紀 @yukinagae グロービス 2018/8 ~ データサイエンティスト(Python/Go) 経歴 元Java/Scala エンジニア
オーストラリアでデータ分析を勉強 → 今に至る 最近はベイズ統計モデリングに興味ある(˘ω˘) スヤァ
Agenda 1. kaggle とは? 2. kaggle の仕組み 3. やってみた( `・ω
・´) 3
1. kaggle とは? 4
世界最大の機械学習・データ分析の コンペを主催するプラットフォーム 5
つまり 6
データサイエンティストの 世界最強を決める大会 7
kaggle の規模 ユーザ数: 50 万以上 国: 190 カ国以上 らしい( `・ω
・´) 8
2. kaggle の仕組み 9
大まかな流れ 1. 主催者(企業など)がコンペを主催する a. データを準備 b. 問題を定義する 2. 参加者は様々な手法を使ってベストなモデルを構 築し、予測を提出する
スコアやランキングが分かる 3. 主催者は、精度が高い予測に賞金を払う 10
ということで 11
3. 早速kaggle をやってみた ( `・ω ・´) 12
1. コンペを選ぶ 13
例えばこのコンペ( `・ω ・´) 14
2. コンペの内容を読む 1. 概要: 大まかに把握 2. 評価指標: これが一番大事( `・ω ・´)
3. 賞金: できればほしいよね 4. 期限: 時間厳守 5. データ: だいたいCSV ファイル(BigQuery も) 15
3. 他の参加者から学ぶ 1. コード(kernel ) 2. ディスカッション(discussion ) 16
いろんな人がコードを載せてくれてるので助かる see: Simple Exploration+Baseline - GA Customer Revenue | Kaggle
17
4. 他の参加者の方法を真似てみる コードをパクってローカルPC で実行するだけの簡単 なお仕事( `・ω ・´) 18
5. 助け合う <= New! ちょうどライブラリのバージョンで上手く動作しなか ったので、上手くいった方法を教え合う( `・ω ・´) 19
6. めんどくさいので人のコードを fork する 20
fork したコードを実行するだけ( `・ω ・´) 21
実行中 22
7. 予測を提出する 23
8. スコアとランクを確認 689 位(全1,031 チーム) ちーん( `・ω ・´) 24
結局言いたいのは 25
パクった後が勝負 26
まとめ kaggle はデータサイエンティストのNo.1 を決める 大会 とりあえず人のコードをパクって頑張る kaggle は沼( `・ω ・´)
27
参考資料 Kaggle - Wikipedia What is Kaggle, Why I Participate,
What is the Impact? fast.ai · Making neural nets uncool again deeplearning.ai: Announcing new Deep Learning courses on Coursera 28
おわり( `・ω ・´) ようこそkaggle 沼へ 29
最後にいちおう We're hiring! 30