Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データサイエンス100本ノック(構造化データ加工編) No1~40までをSQLで書いてみて

データサイエンス100本ノック(構造化データ加工編) No1~40までをSQLで書いてみて

社内のML技術情報共有会

wakama1994

June 21, 2022
Tweet

More Decks by wakama1994

Other Decks in Programming

Transcript

  1. 取り組んだ理由 最近仕事でGoogle Data portalを活用した案件を担当 ➢ Data portalとの連携上、Google Big Queryを活用する機会も増えた ➢

    pythonに比べ使いやすいケースも結構ある ➢ その一方、複雑な処理になると、コーディングが難しい • SQLの練習ができつつも、その他の言語との比較をして、適切なタイミング でBig Queryを使えるようになりたい!
  2. 実務で使いたい方(参考) データベースの構築は厳しいと思うので、 Google Big Queryが個人的にはオススメ • csvがローカルからのアップロードが可能 な他、S3やドライブからもアップロード 可能 •

    社内だと、csvデータの処理が現状多いで すが、サクッとデータ切り出したい時は pythonよりは楽(と思う) ◦ ただしカラム表記が日本語対応していないの が、欠点 uery-create-table-by-local-file-upload/