Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
古参Numerai参加者の戯言
Search
regonn
December 18, 2021
Technology
1
2.4k
古参Numerai参加者の戯言
@Numerai Meetup JAPAN2021
2021/12/18
regonn
December 18, 2021
Tweet
Share
More Decks by regonn
See All by regonn
Submission with Numerai Compute using GCP Batch
regonn
0
550
HelloMoon x Orca=HelloOrca
regonn
0
130
The Challenge of Automatically Configuring Numerai Compute Environment
regonn
0
93
Federated Learning 連合学習
regonn
4
1.7k
PLATEAUをデータベースに取り込んでみた
regonn
0
1.7k
Nim + Cloud Run + TerraformでGCPにNimのサーバーレス環境を作る
regonn
1
640
S+ Camera Basicと似た環境をラズパイから構築してみる
regonn
0
510
衛星画像のゴルフ場写り込み判定AIモデルを作る
regonn
0
760
データラーニングギルド での活動と今後
regonn
0
170
Other Decks in Technology
See All in Technology
大規模イベントに向けた ABEMA アーキテクチャの遍歴 ~ Platform Strategy 詳細解説 ~
nagapad
0
160
【CEDEC2025】『Shadowverse: Worlds Beyond』二度目のDCG開発でゲームをリデザインする~遊びやすさと競技性の両立~
cygames
PRO
1
240
Rubyの国のPerlMonger
anatofuz
3
700
金融サービスにおける高速な価値提供とAIの役割 #BetAIDay
layerx
PRO
1
600
経験がないことを言い訳にしない、 AI時代の他領域への染み出し方
parayama0625
0
290
「手を動かした者だけが世界を変える」ソフトウェア開発だけではない開発者人生
onishi
15
8.1k
「AI駆動開発」のボトルネック『言語化』を効率化するには
taniiicom
1
240
モバイルゲームの開発を支える基盤の歩み ~再現性のある開発ラインを量産する秘訣~
qualiarts
0
1.1k
With Devin -AIの自律とメンバーの自立
kotanin0
2
1k
帳票構造化タスクにおけるLLMファインチューニングの性能評価
yosukeyoshida
1
220
生成AI時代におけるAI・機械学習技術を用いたプロダクト開発の深化と進化 #BetAIDay
layerx
PRO
1
840
【CEDEC2025】ブランド力アップのためのコンテンツマーケティング~ゲーム会社における情報資産の活かし方~
cygames
PRO
0
220
Featured
See All Featured
Site-Speed That Sticks
csswizardry
10
740
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
Docker and Python
trallard
45
3.5k
Rebuilding a faster, lazier Slack
samanthasiow
83
9.1k
Statistics for Hackers
jakevdp
799
220k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
870
Art, The Web, and Tiny UX
lynnandtonic
301
21k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
45
7.5k
Designing for Performance
lara
610
69k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
139
34k
The Invisible Side of Design
smashingmag
301
51k
The Cost Of JavaScript in 2023
addyosmani
51
8.7k
Transcript
古参Numerai 参加者の戯言 れごん@Numerai Meetup JAPAN2021 2021/12/18
自己紹介 • れごん • @regonn_haizine • 島根のフリーランス • データサイエンス系のポッドキャスト Regonn&Curry.fm
やってます
Numeraiの活動 • 2017年2月からやっているらしい • 当時はLoglossとOriginarityという指標 だった • Julia とかで挑んでいた記録が残ってた •
Juliaで並列計算を試す • https://blog.regonn.tokyo/data-science/2017- 10-24-julia-numerai-multi/
• このまま昔話をしていると 某HUNTER漫画の新人つぶし の人みたいになってしまう 自主規制
Numeraiの すゝめ • Numeraiの個人的に気に入っている部分を話 していきます • データサイエンスをこれから触っていきた いor学んでいきたい人にはオススメの題材 だと思う •
ブロックチェーン(仮想通貨)の知識も必要 だけど 、ブロックチェーンの活用の広がり をみると触っといていいのではぐらいの感 触
なぜNumeraiがオススメなのか? • Kaggle等のデータサイエンスコンペサイト等で実力を磨く のも大事だけど次の実践的な観点が育ちにくい • データを自分で取得して、利用したい形に整形する • 継続して長期間同じデータに触る(予測対象が変化する) • コードに関する他の人とのディスカッション
• データサイエンスの観点というより、ベターなコー ドの書き方等
理想的な プロジェクト • 半永久的に続く • コンペと違って長い間取り組める • 知見がたまる • 新しいツールやライブラリを試す指標になる
• データがオープン • 他の人と議論したりコードの公開をしても許さ れる(PrivateShareという概念は無いが、MMCが 下がるので共同で書いたコード等は注意) • 多少でも儲かる • 儲けが出ると、GPUインスタンスとか試せる • 儲けが指標になるので成長等も実感しやすい 向いているプロジェクトの性質
データサイエンス の趣味プロダクト でお金を稼ぐ例 Numerai • データが揃っている状態(Tournament)から始められ、自分でデータの取 得や管理もできる(Signals) • データ分析環境さえあれば一通り完結する •
税金の計算が面倒 競馬や競艇等の公営ギャンブル予測 • 自分でデータを収集する必要がある • 賭ける場合もAPIを叩くためのインフラ構築が必要(競輪とかはAPIも現 状無いはず) • 税金の計算が面倒 自動売買(システムトレード) • BOTを動かすためのインフラ構築が必要 • まだ、仮想通貨系はいいけど、株取引とかでAPIでの取引環境は大変 なイメージ • データを自分で用意する必要がある • 税金の計算が面倒(株取引やFXは楽かも)
モブプロ会 • モブプログラミングという複数人でコード を書くスタイル • 複数人の知見が共有される • コードの書き方について議論できる • 質の高いコードが出来上がりやすい
• 他の輪読会等に比べて参加者は事前準備 はほぼ必要無い
一時期モブプロもやってました
Kaggleや仕事以外の 機械学習プロジェクトを Numeraiでやってみよう