Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Numerai2024年のアップデートと戦略
Search
Nishimoto
July 18, 2024
Programming
0
640
Numerai2024年のアップデートと戦略
Numerai2024 Tokyoでトーク予定の資料です
Nishimoto
July 18, 2024
Tweet
Share
Other Decks in Programming
See All in Programming
CSC509 Lecture 04
javiergs
PRO
0
300
Go言語の特性を活かした公式MCP SDKの設計
hond0413
1
230
アメ車でサンノゼを走ってきたよ!
s_shimotori
0
220
The Past, Present, and Future of Enterprise Java
ivargrimstad
0
310
非同期jobをtransaction内で 呼ぶなよ!絶対に呼ぶなよ!
alstrocrack
0
890
なぜあの開発者はDevRelに伴走し続けるのか / Why Does That Developer Keep Running Alongside DevRel?
nrslib
3
400
Flutterで分数(Fraction)を表示する方法
koukimiura
0
130
Domain-centric? Why Hexagonal, Onion, and Clean Architecture Are Answers to the Wrong Question
olivergierke
2
840
大規模アプリのDIフレームワーク刷新戦略 ~過去最大規模の並行開発を止めずにアプリ全体に導入するまで~
mot_techtalk
1
440
10年もののAPIサーバーにおけるCI/CDの改善の奮闘
mbook
0
820
Web フロントエンドエンジニアに開かれる AI Agent プロダクト開発 - Vercel AI SDK を観察して AI Agent と仲良くなろう! #FEC余熱NIGHT
izumin5210
3
530
バッチ処理を「状態の記録」から「事実の記録」へ
panda728
PRO
0
160
Featured
See All Featured
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3k
Why You Should Never Use an ORM
jnunemaker
PRO
59
9.6k
Docker and Python
trallard
46
3.6k
The Cult of Friendly URLs
andyhume
79
6.6k
Leading Effective Engineering Teams in the AI Era
addyosmani
4
380
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
140
34k
A designer walks into a library…
pauljervisheath
209
24k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.6k
Rails Girls Zürich Keynote
gr2m
95
14k
Site-Speed That Sticks
csswizardry
11
900
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.9k
A Tale of Four Properties
chriscoyier
161
23k
Transcript
Updates and Strategy for Numerai in 2024 - v4.3 &
v5.0 data analysis - Numerai Tokyo Meetup 2024/07/20
- Nishimoto - Twitter: @nishimt_general - Kaggle: nishimoto -
ML Engineer at Web service company - NLPやLLMで業務効率化 自己紹介 2
目次 3 • Numerai Updates from 2023 to 2024 ◦
データのアップデート ◦ 評価指標がTCからMMCに • Numerai Strategy for 2024 ◦ V4.3 ベンチマークデータ解析 ◦ Targetを使わないでEraの特徴を捉える ◦ V5.0 データ解析 • まとめ
Numerai Updates from 2023 to 2024 • メジャーなアップデート ◦
評価指標がTCからMMCに (link) ◦ データのアップデート (v4.2 → v4.3 → v5.0; link) • その他アップデート ◦ Model uploads(link) ◦ とても便利 4
https://numer.ai/data/v4.3 特徴量大幅増加(2376 features) もはやメモリで読み込めないデータ量 ベンチマークが使用可能に メジャーアップデート - data update(v4.3) 5
https://numer.ai/data/v5.0 (発表の3日前に公開された) - (たぶん)新しい特徴はない - Universe(ターゲット)が増えた メジャーアップデート - data update(v5.0)
6 Copilot
・MMC(Meta Model Contribution) とCorrelationが評価指標に ・Staking は 0.5corr + 2MMCに ・MMCはローカルで計算可能;
参考 メジャーアップデート - 評価指標の変化 7
目次 8 • Numerai Updates from 2023 to 2024 ◦
データのアップデート ◦ 評価指標がTCからMMCに • Numerai Strategy for 2024 ◦ V4.3 ベンチマークデータ解析 ◦ Targetを使わないでEraの特徴を捉える ◦ V5.0 データ解析 • まとめ
・ベンチマークとは? → Numeraiによりベンチマークの予測結果が配布されている Announcements ・ベンチマークとメタモデルの相関を計算 ・ベンチマークのMMCを算出 V4.3 ベンチマークデータ解析 9
v4.2データ系モデルが Era > 1083以降は強く相関 ベンチマーク vs メタモデルの相関 10
ベンチマーク vs メタモデルの相関 11 最新10Eraでの相関平均値 All benchmark
ベンチマークのMMC値(全ベンチマーク) 12 全体的な動きは似てる...かも?
→ Targetとの相関が高いと、MMCも高くなる ベンチマークのMMC値 13 Correlation between Benchmark vs Target
全Era 最新10 Era X: ベンチマークのTarget値との相関係数 Y: MMC
→ メタモデルと相関が低い方が、MMC値は高くなる しかし、最新10Eraではその傾向は見られない ベンチマークのMMC値(ベンチマーク vs メタモデル) 14 Correlation between
metamodel 全Era 最新10 Era X: ベンチマーク予測値とメタモデル予測値の相関 Y: MMC
・ベンチマークにより検証が簡単に → 「V4.2 rain ensemble」がメタモデルと高い相関(疑似メタモデルとして使用し てもいいかも) ・高MMC取得のために → Targetと高い相関+メタモデルと低い相関が重要
まとめ - v4.3ベンチマーク解析 15
目次 16 • Numerai Updates from 2023 to 2024 ◦
データのアップデート ◦ 評価指標がTCからMMCに • Numerai Strategy for 2024 ◦ V4.3 ベンチマークデータ解析 ◦ Targetを使わないでEraの特徴を捉える ◦ V5.0 データ解析 • まとめ
知りたいこと:各Eraの特徴を知りたい → 各Eraごとに特徴量間の相関係数を全通り計算、相関係数の値を各Eraの特徴とする feat1-feat2 feat1-feat3 feat2-feat3 Era1 0.5 -1
0.5 Era2 1 -1 0.7 Era3 ... ... ... Targetを使わないでEraの特徴を捉える 17 era feat1 feat2 feat3 sample1 1 3 2 1 sample2 1 1 2 2 sample3 2 1 2 2 sample4 2 3 4 1 sample5 ... ... ... ... Numerai data feat vs feat per Era data Era1 vs Era2 correlation: 0.8 Era1 vs Era3 correlation: 0.7.... Use medium(705features) data
古いEraはかなり相関が低い(Era < 106) 逆に、近いEraがかなり相関高い Targetを使わないでEraの特徴を捉える 18 Correlation(Spearman) Latest era
Era
データをよく見てみると、Eraが小さいところではすべての値が同じ列などが散見される Targetを使わないでEraの特徴を捉える 19
Targetを使わないでEraの特徴を捉える - 評価 20 Mean: 0.017, Sharpe: 0.832 Era Era
Mean: 0.017, Sharpe: 0.835 全Era 古いEra除外(Era > 106) Corr → 除外すればうまくいく...わけではない
目次 21 • Numerai Updates from 2023 to 2024 ◦
データのアップデート ◦ 評価指標がTCからMMCに • Numerai Strategy for 2024 ◦ V4.3 ベンチマークデータ解析 ◦ Targetを使わないでEraの特徴を捉える ◦ V5.0 データ解析 • まとめ
https://numer.ai/data/v5.0 (発表の3日前に公開された) - (たぶん)新しい特徴はない - Universe(ターゲット)が増えた - Trainingだと20%くらいターゲットが 増えてる メジャーアップデート
- data update(v5.0) 22 Copilot
V5.0 データ解析 23 v4.3(Mean: 0.0223, Sharpe: 0.8976) v5.0(Mean: 0.0264,
Sharpe: 1.1396) Era Era Correlation とりあえず予測(medium features, target only)
V5.0 データ解析 24 v4.3(Mean: 0.0174, Sharpe: 0.9028) v5.0(Mean: 0.0003,
Sharpe: 0.0237) Era Era Correlation とりあえず予測(medium features, target only, 100% feature neutlization )
Targetを使わないでEraの特徴を捉える(v4.3 & v5.0) 25 v4.3 v5.0 Era Era Correlation 前章の「Targetを使わないでEraの特徴を捉える」を
v4.3 & v5.0 データで実施
まとめ ・評価指標のアプデがあった ・V4.3のベンチマークの解析から - targetとの相関は高く - メタモデルとの相関は低く ・V4.3データのtargetを使わないEra解析より - 特徴量間の関係性が古いデータでは変わっている
- 新規データの方が関係性が保たれている ・V5.0データ解析 - Feature neutralizationいらないかも? - 予測Universeは変わったが、特徴量間の相関の雰囲気は変わってなさそう 26
Links - Analyze benchmark - Non target era features -
Simple prediction 27
Thank you! 28