Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Kaggleに置かれているデータを 可視化する
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
ksnt
December 09, 2020
Programming
430
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Kaggleに置かれているデータを 可視化する
ksnt
December 09, 2020
More Decks by ksnt
See All by ksnt
AutoGenを触ってみた
ksnt
0
350
データ分析者にとってのDjango: StreamlitやDashとの比較
ksnt
1
2k
データ分析で切り拓け! エンジニアとしてのデータ分析職キャリア戦略
ksnt
0
1.1k
勉強会で発表してみよう!
ksnt
0
340
CourseraのDigital Transformationというコースを受けてみた
ksnt
2
720
Pythonで挑む計算社会科学
ksnt
0
1.5k
turtleであそぼう!
ksnt
0
310
データ分析と競技プログラミングに使えるPython標準ライブラリ入門
ksnt
1
670
DashユーザーがStreamlitを使ってアプリケーションをつくってみた
ksnt
0
2.2k
Other Decks in Programming
See All in Programming
ローカルLLMを使ってB2Bサービスを作っていての学び
yaotti
0
170
Javaの型とAI時代に型が大事な理由 / java types and type in AI era
kishida
2
130
LLM本来の能力を解き放つサンドボックス技術とAI民主化への適用
yukukotani
3
3.9k
AI時代のUIはどこへ行く?その2!
yusukebe
21
7.1k
Semantic Version 単位で戦略を柔軟に変えて、パッケージアップデートを自動化する
daitasu
1
240
LLMによるContent Moderationの本番運用の裏側と品質担保への挑戦
suikabar
2
640
jQueryをバージョンアップする前に使いたいjQuery Migrate
matsuo_atsushi
0
480
並列実装の現場、2ヶ月間実務でAIを使い倒したAIもPCも私も限界が近い
ming_ayami
0
130
Even G2とAWSで推しのエージェントを召喚しよう!
har1101
1
110
メソッドのジェネリクスでGoの夢は広がるか? / Kyoto.go #65
utgwkk
3
760
TAKTでAI駆動開発の品質を設計する
j5ik2o
6
1.3k
Snowflake Summitでの新機能 CoCo / CoWork / snowflake-summit-2026-overall-what-new-coco
tatsuhiro
1
130
Featured
See All Featured
Paper Plane
katiecoart
PRO
1
51k
Designing for Timeless Needs
cassininazir
1
250
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
160
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
1.1k
A Tale of Four Properties
chriscoyier
163
24k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.9k
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
390
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Being A Developer After 40
akosma
91
590k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
YesSQL, Process and Tooling at Scale
rocio
174
15k
A Modern Web Designer's Workflow
chriscoyier
698
190k
Transcript
Kaggleに置かれているデ置かれているデーかれているデータをデータをを 可視化するするデータを ksnt
自己紹介 • PyCon mini Hiroshima スタをッフ • はんなりPython 運営
kaggleとは? • 2010年に米国でスターに置かれているデ米国でスタートしたでスタートしたデスタをートしたデータサイしたデータサイエンデータをサイエンスコン ペティションサイトしたデータサイ • 2020年に米国でスター5月時点で登録者数ベーでスタートしたデ登録者数ベースでベースでスタートしたデ10万人以上 のデータサイエンデータをサイエンティストしたデータサイが参加参加 • 実際のデータ・課題のデータサイエンデータを・課題に対して、課題に対して、様々に置かれているデ対して、様々なデして、様々なデータサ様々なデータサイエなデータをサイエン ティストしたデータサイが参加オンライン上でスタートしたデ意見をかわしながらをかわしなが参加らそのデータサイエン結
果が即時に採点さが参加即時に置かれているデ採点で登録者数ベーされ競い合うことがでい合うことができるうことが参加でスタートしたデきるデータを
Compete, Data, Notebooks, Communities • Compete – 開催されているコンされているデータをコンペが参加表示 • Data
– データをが参加たデータサイエンくさん置かれているデーかれているデータを • Notebooks – ノートしたデータサイブックがたくさん置かが参加たデータサイエンくさん置かれているデーかれて いるデータを • Communities - ディスカッションが参加行われていわれてい るデータを
コンペのデータサイエン種類 • Predictコンペ ▪ もっともスタをンダードなコンペなコンペ ▪ データををDLしてきて任意のデータサイエン環境で分析 でスタートしたデ分析 or Kaggle上でスタートしたデ分析
▪ 複雑なアンサンブルなアンサンブルモデルが参加上位にくることもあに置かれているデくるデータをこともあり上位にくることもあソリューションは実務に活用しづらいに置かれているデ活用しづらいものにしづらいものデータサイエンに置かれているデな るデータをこともあるデータを(らしい) • Codeコンペ ▪ Kaggleのデータサイエンオンライン環境で分析 でスタートしたデ分析するデータをことが参加条件 ▪ 処理時間の制限があったのデータサイエン制限があったりしてが参加あったデータサイエンりして過度に複雑な処理なに置かれているデ複雑なアンサンブルな処理などは制限があったりしてされるデータを • 最適化するコンペ ▪ 最適解をいかに早く見をいかに置かれているデ早く見つけるかをく見をかわしながらつけるデータをかを競い合うことがでう ▪ 「サンタをコンペ」 • Simulationコンペ ▪ ゲームなどにおいて高などに置かれているデおいて高得点で登録者数ベーを取得するデータをたデータサイエンめのデータサイエン自動で動くプログラでスタートしたデ動で動くプログラくプログラムなどにおいて高を作成するするデータを • 可視化するコンペ
Los Angeles Traffic Collision Data • Libraries folium (Lealet.jsのデータサイエンPythonラッパー) •
Data https://www.kaggle.com/cityofLA/los-angeles-traffic-c ollision-data • Notebook https://www.kaggle.com/ksn0215/introduction-to- geospatial-analysis-with-leaflet
Data Science for Good: Center for Policing Equity How do
you measure justice? • Libraries plotly • Data https://www.kaggle.com/center-for-policing-equity/data-science-for- good • Notebook https://www.kaggle.com/ksn0215/measurement-of-justice-in-boston
Global Terrorism Database More than 180,000 terrorist attacks worldwide, 1970-2017
• Libraries plotly/Dash • Data https://www.kaggle.com/START-UMD/gtd • Video https://drive.google.com/file/d/1428V6qrFP- JvWYHYe7kc6V54apw0Yvde/view
まとめ • KaggleのデータサイエンページからデータをからデータををDLしてきて可視化するし てみるデータをととても勉強になるに置かれているデなるデータを • 場合うことができるに置かれているデよってはメダルが参加もらえるデータをかも • Kaggleのデータサイエンデータをは実データをに置かれているデ比べると使いやすべるデータをと使いやすいいやすい ものデータサイエンが参加多い印象なのでよい印象なのでよい練習なのデータサイエンでスタートしたデよい練習になるに置かれているデなるデータを
おまけ - おすすめ書籍
Let’s get started!