Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データラーニングギルド での活動と今後

データラーニングギルド での活動と今後

データラーニングギルド1周年LTでの発表資料です

regonn

July 23, 2020
Tweet

More Decks by regonn

Other Decks in Technology

Transcript

  1. ギルドでの活動 • Kaggleに取り組むチームを募集してみた • IEEEコンペ • 銀メダル • 2019 Data

    Science Bowlコンペ • 銅メダル • M5コンペ • 銅メダル • 結果としては悪くない
  2. 見えてきた課題 • チームメンバーの成長につながって いるのか? • 自分も含めて成長しているのか が見えにくい • 質の良いコードが書けていない •

    タイムリミットがあるコンペだ と雑なコードで終わる場合も多 いし、コードレビューをするわ けではないので、オレオレ Pythonコードになりやすい • コードも公開しにくい • データに制限があるので書いた コードも共有しにくくアウト プットが難しい
  3. マイプロジェクト? 向いているプロジェクトの性質 半永久的に続く •コンペと違って 長い間取り組め る •知見がたまる •新しいツールや ライブラリを試 す指標になる

    データがオープン •他の人と議論し たりコードの公 開がやりやすい 多少でも儲かる •儲けが出ると、 GPUインスタンス とか試せる •儲けが指標にな るので成長等も 実感しやすい Kaggle等のコンペサイト以外での 機械学習プロジェクトを持つ
  4. 自分が進めて いるマイプロ ジェクト •データサイエンスティストが協力して動かす ヘッジファウンド •Kaggleみたいにデータを渡されて、予測を提出し て仮想通貨トークンをステーキングすると、貢 献度に応じて報酬がもらえる Numerai •ボートレース

    •距離や船の数が一定なので、機械学習しやすい 競艇予測 •自分はリアルタイムでの取引よりも、次の日の 予測の方が精神的にも安定していた 自動売買(システムトレード)
  5. モブプロ会? • モブプログラミングという複数人で コードを書くスタイル • 複数人の知見が共有される • コードの書き方について議論で きる •

    質の高いコードが出来上がりや すい • 他の輪読会等に比べて参加者は 事前準備はほぼ必要無い