Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
資産間の相関関係を頑健に評価する指標を用いたファクターアローケーション戦略の構築
Search
s-noma
February 17, 2025
Research
0
59
資産間の相関関係を頑健に評価する指標を用いたファクターアローケーション戦略の構築
第62回 JAFEE大会 報告資料
http://www.jafee.gr.jp/01rally/conference/pro_62th_0215.pdf
s-noma
February 17, 2025
Tweet
Share
More Decks by s-noma
See All by s-noma
大規模言語モデルを用いたニュースデータのセンチメント判定モデルの開発および実体経済センチメントインデックスの構成
nomamist
0
110
解釈性を持つリスクファクター構成手法に関する研究
nomamist
1
130
解釈性とローディングの密性を両立するリスクファクター抽出手法
nomamist
0
210
Other Decks in Research
See All in Research
Weekly AI Agents News! 11月号 プロダクト/ニュースのアーカイブ
masatoto
0
290
移動ビッグデータに基づく地理情報の埋め込みベクトル化
tam1110
0
240
アプリケーションから知るモデルマージ
maguro27
0
260
ラムダ計算の拡張に基づく 音楽プログラミング言語mimium とそのVMの実装
tomoyanonymous
0
400
Segment Any Change
satai
2
210
The Economics of Platforms 輪読会 第1章
tomonatu8
0
140
o1 pro mode の調査レポート
smorce
0
110
書き手はどこを訪れたか? - 言語モデルで訪問行動を読み取る -
hiroki13
0
140
Large Vision Language Model (LVLM) に関する最新知見まとめ (Part 1)
onely7
24
5.9k
医療支援AI開発における臨床と情報学の連携を円滑に進めるために
moda0
0
150
Bluesky Game Dev
trezy
0
140
AIトップカンファレンスからみるData-Centric AIの研究動向 / Research Trends in Data-Centric AI: Insights from Top AI Conferences
tsurubee
3
1.5k
Featured
See All Featured
Bash Introduction
62gerente
611
210k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
BBQ
matthewcrist
87
9.5k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.1k
Become a Pro
speakerdeck
PRO
26
5.1k
Visualization
eitanlees
146
15k
Build The Right Thing And Hit Your Dates
maggiecrowley
34
2.5k
Designing for humans not robots
tammielis
250
25k
Mobile First: as difficult as doing things right
swwweet
223
9.3k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
29
1k
Art, The Web, and Tiny UX
lynnandtonic
298
20k
Transcript
資産間の相関関係を 頑健に評価する指標を用いた ファクターアローケーション戦略の構築 2025年2月16日 Japan Digital Design株式会社 MUFG AI Studio
野間 修平 1 本報告の内容は筆者に帰属し,所属する組織としての見解を示すものではない. また,本報告にある誤りは全て筆者の責に帰する. 第62回 JAFEE大会 報告資料
本研究の概要 • 機械学習手法を用いた動的ファクターアロケーション戦略を構築 本研究の位置付け 2 序論 ロバスト 相関 数値実験 バック
テスト 結論 補論 動的ファクターアロケーション 経済指標で局面判定 Varsani and Jain (2018) Polk et al. (2020) 景気サイクルに基づく
本研究の概要 • 機械学習手法を用いた動的ファクターアロケーション戦略を構築 本研究の位置付け 3 序論 ロバスト 相関 数値実験 バック
テスト 結論 補論 動的ファクターアロケーション 経済指標で局面判定 Varsani and Jain (2018) Polk et al. (2020) 景気サイクルに基づく 資産間の相関で 局面判定 本研究 資産間の相関は経済と連動 Ilmanen (2003), Li (2004) 経済指標は 遅行的
本研究の概要 • 機械学習手法を用いた動的ファクターアロケーション戦略を構築 本研究の位置付け 4 序論 ロバスト 相関 数値実験 バック
テスト 結論 補論 動的ファクターアロケーション 経済指標で局面判定 Varsani and Jain (2018) Polk et al. (2020) 景気サイクルに基づく 資産間の相関で 局面判定 本研究 資産間の相関は経済と連動 Ilmanen (2003), Li (2004) 外れ値に対して鋭敏 [Huber and Ronchetti (2011)] 経済指標は 遅行的 相関関係を頑健に評価する 指標を提案
本報告のアウトライン ⚫ 序論 ⚫ 頑健な相関評価指標 ⚫ 数値実験 ⚫ バックテスト ⚫
結論 ⚫ 補論 5 序論 ロバスト 相関 数値実験 バック テスト 結論 補論
先行研究① 景気サイクルに基づく動的ファクターアロケーション • 経済指標などに基づいて景気サイクルを判断 [Varsani and Jain (2018)], [Polk et
al. (2020)] 問題点①: 経済指標の公表は経済に遅行 相場は経済の先行きを織り込んで遷移 問題点②: 各局面においてリスクを取得するファクターを帰納的に決定 問題点③: Breath(投資判断の回数)が少ない ← 景気サイクル1周につき配分変更は4回 6 序論 ロバスト 相関 数値実験 バック テスト 結論 補論 バリュー 小型 高配当 バリュー 小型 バリュー 小型 モメンタム バリュー 小型 モメンタム クオリティ 低ボラ モメンタム クオリティ 低ボラ クオリティ 低ボラ バリュー クオリティ 低ボラ モメンタム Recovery Expansion Slowdown Contraction Varsani and Jain (2018) Polk et al. (2020)
先行研究② 資産の相関関係は景気サイクルを代理 • [Ilmanen (2003)] • 株と債券の相関はインフレ率の急騰により上昇 • 株と債券の相関は不況期に低下 •
[Li (2004)] • 株と債券の相関は期待インフレ率の不確実性 ⋅ 1⋅によって説明される 相関係数の問題点: 外れ値に鋭敏 • 資産のリターンは外れ値を含む → 相関係数は指標として不適 7 序論 ロバスト 相関 数値実験 バック テスト 結論 補論 1 長期金利からGDP成長率の5年平均を減じた系列を「期待インフレ率の不確実性」として定義している.
本報告のアウトライン ⚫ 序論 ⚫ 頑健な相関評価指標 ⚫ 数値実験 ⚫ バックテスト ⚫
結論 ⚫ 補論 8 序論 ロバスト 相関 数値実験 バック テスト 結論 補論
相関関係を頑健に評価する指標の提案 通常の相関係数が有する特徴 • 外れ値に対して鋭敏 [Huber and Ronchetti (2011)] • 正規分布を仮定している
資産のリターンの特徴と相関関係を評価する指標が満たすべき要請 • 外れ値が生じやすい → 外れ値に対して頑健 • 非正規性を有する [Mandelbrot (1997)] → 特定の分布を仮定しない 9 序論 ロバスト 相関 数値実験 バック テスト 結論 補論 【アイデア】 サンプルごとに相関の程度をスコアとして評価し,その平均を指標とする RobustCor(𝑥, 𝑦) ≔ 1 𝑇 𝑡∈ 𝑇 𝑓 𝑥𝑡 , 𝑦𝑡
相関関係を頑健に評価する指標の提案 「相関の程度を評価するスコア」の定義 • スコアが満たすべき要請 • 順相関であれば正,逆相関であれば負となる • 資産価格の変動率が大きい程,スコアの絶対値も大きくなる 10 序論
ロバスト 相関 数値実験 バック テスト 結論 補論 RobustCor(𝑥, 𝑦) ≔ 1 𝑇 𝑡∈ 𝑇 𝑓 𝑥𝑡 , 𝑦𝑡 𝑓 𝑥𝑡 , 𝑦𝑡 ≔ tanh 𝑥𝑡 + 𝑦𝑡 2 − 𝑥𝑡 − 𝑦𝑡 2 相関を評価するスコア 𝑓 ⋅,⋅ : リターン 𝑥𝑡 , 𝑦𝑡 は 絶対値の中央値 Median 𝑥𝑡 𝑡 で 尺度化されているとする
相関関係を頑健に評価する指標の提案 正規化定数 • 正規分布を仮定したときに指標が -1 から 1 の間に収まるような正規化定数を求める • フルヴィッツのゼータ関数
𝜁 ⋅,⋅ を用いる 11 序論 ロバスト 相関 数値実験 バック テスト 結論 補論 提案指標 通常の相関 正規化定数 𝑲 を導入することにより -1 から 1 の値をとりやすくなる
本報告のアウトライン ⚫ 序論 ⚫ 頑健な相関評価指標 ⚫ 数値実験 ⚫ バックテスト ⚫
結論 ⚫ 補論 12 序論 ロバスト 相関 数値実験 バック テスト 結論 補論
人工データ実験 ロバスト性の確認 • 2種の二変量正規分布からデータを合計 100,000 サンプル生成 • 相関はターゲット分布が 0.6,汚染分布が 0
とした • 汚染率を 0% から 10% まで変化させる • 通常の相関と提案指標で相関関係を評価 • 通常の相関は汚染率 10% で 0 近傍に 13 序論 ロバスト 相関 数値実験 バック テスト 結論 補論 提案指標 ゆるやかに低下 通常の相関 急低下 真の相関 相関 0.6 相関 0 汚染率 10%
市場データ実験 株と金利の相関 • S&P500 と 米国債10年金利 の 250営業日ローリング相関 を評価 •
両者の推移は類似 • しかし,通常の相関は振動的かつジャンプが散見される • 景気サイクルを代理する特徴量として望ましくない性質 14 序論 ロバスト 相関 数値実験 バック テスト 結論 補論 振動的 ジャンプ 通常の相関 提案指標 ジャンプ
本報告のアウトライン ⚫ 序論 ⚫ 頑健な相関評価指標 ⚫ 数値実験 ⚫ バックテスト ⚫
結論 ⚫ 補論 15 序論 ロバスト 相関 数値実験 バック テスト 結論 補論
セットアップ 投資対象 • MSCI社が提供する米国株式市場の 7種 のファクターインデックス(左下表) • MSCI US とのリスク調整相対リターンを「ファクターリターン」と定義
• 推論結果に基づきファクターリターンに対して取得するリスクを調整する 16 序論 ロバスト 相関 数値実験 バック テスト 結論 補論 𝑟𝑡 Factor ≔ 1 𝜎𝑡 Index ⋅ 𝑟𝑡 Index − 1 𝜎𝑡 Beta ⋅ 𝑟𝑡 Beta リスク調整して 累和
セットアップ 特徴量 • 27本の系列に3種類の前処理を施して特徴量とする • ファクターリターンの累和インデックス(1本) • ロバスト相関(26ペア) • 前処理
① 𝑑 営業日変化 ② 直近 𝑑 営業日最大値からの変化 ③ 直近 𝑑 営業日最小値からの変化 17 序論 ロバスト 相関 数値実験 バック テスト 結論 補論 ② ③ ① 𝑑 ∈ 5, 10, 21, 63, 125
セットアップ 特徴量 - ロバスト相関を計算する資産ペア 18 序論 ロバスト 相関 数値実験 バック
テスト 結論 補論
セットアップ 機械学習タスク: 二値分類問題 • リスク調整20営業日将来リターンに基づき2種類のラベルを用意する • 上昇ラベル: +0.3𝜎 以上であれば 1
ラベルを付す • 下落ラベル: −0.3𝜎 以下であれば 1 ラベルを付す 19 序論 ロバスト 相関 数値実験 バック テスト 結論 補論 +0.3 -0.3 リスク調整 20営業日 将来リターン -0.3以下 0近傍 +0.3以上 上昇ラベル 0 0 1 下落ラベル 1 0 0 20営業日後の方向を予測する (≠回帰問題) 三値分類問題ではなく 2つの二値分類問題を用意する
セットアップ 予測モデル: 決定木 • 決定木を選択した理由 • 訓練アルゴリズムが決定的 • 表現力が高すぎない( GBDT,
ニューラルネットワーク, etc.) • 特徴量とラベルの非線形な関係を表現することができる 20 序論 ロバスト 相関 数値実験 バック テスト 結論 補論 非線形の関係を表現できることを要請した理由: Good News is Bad News 金融相場 業績相場 逆金融相場 逆業績相場 景気 サイクル 景況感 株↓ 株↑ 株↓ 株↑ 株↑ 株↓ 株↑ 株↓ 期待EPSの上昇 割引率の上昇
セットアップ 決定木のチューニングパラメータ • 合計 9組 のチューニングパラメータセット • 木の最大深さ: 4, 5,
6 • 分割の対象とする最小のノードサイズとサンプルサイズの比率: 2%, 3%, 4% 21 序論 ロバスト 相関 数値実験 バック テスト 結論 補論 𝑁 𝑁𝑙 𝑁𝑟 𝑁𝑙𝑙 𝑁𝑙𝑟 𝑁𝑟𝑙 𝑁𝑟𝑟 𝑁𝑙𝑟𝑙 𝑁𝑙𝑟𝑟 木の最大深さ 𝑁𝑟𝑙 𝑁 < 𝑞 で分割を停止
セットアップ 決定木の訓練とポジション構築のタイミング • 執行ラグを考慮してポジションを構築する • 推論(投資判断)とポジション構築は毎営業日行う 22 序論 ロバスト 相関
数値実験 バック テスト 結論 補論 𝑡 + 20 𝑡 − 1 𝑡 第𝑡 − 1営業日の引け後に 第𝑡 − 1営業日までのデータを用いて モデルを訓練 第𝑡 − 1営業日の引け後に訓練した モデルの推論結果に基づき 第𝑡営業日の引けでポジションを構築 20営業日に渡り投資 決定木を訓練
パフォーマンスの計測方法 訓練するモデルの個数 • 各営業日に訓練するモデルの数は 7 × 2 × 9 =
126個 となる • 7つの投資対象(ファクター) • 2種類のラベル(上昇ラベル or 下落ラベル) • 9組のチューニングパラメータセット(最大深さ × 最小分割ノードサイズ) パフォーマンスの計測方法 • チューニングパラメータセットごとにパフォーマンスを計測する • 7 × 2 = 14 の戦略を等ウェイトで持つ戦略として解釈することができる 23 序論 ロバスト 相関 数値実験 バック テスト 結論 補論
パフォーマンス 特性値(計測期間:2009/1/1 – 2019/12/31) 24 序論 ロバスト 相関 数値実験 バック
テスト 結論 補論 提案戦略の R/R は 0.56 ~ 0.78 ファクターリターンの 最良 R/R は 「最小分散」 0.46
パフォーマンス 累和リターン 25 序論 ロバスト 相関 数値実験 バック テスト 結論
補論 ベータ資産との相関 相関は -5.4% から +7.6% と低位 2012年と2018年に 大きめのドローダウンに見舞われるも 通期では右肩上がり
本報告のアウトライン ⚫ 序論 ⚫ 頑健な相関評価指標 ⚫ 数値実験 ⚫ バックテスト ⚫
結論 ⚫ 補論 26 序論 ロバスト 相関 数値実験 バック テスト 結論 補論
結論 結論 • 機械学習手法を用いた動的ファクターアロケーション戦略を構築した • アロケーション戦略は景気サイクルに基づく • 景気サイクルは資産間の相関関係で代理することを提案 • 相関関係を頑健に評価する指標を提案
• 有効性を①人工データ実験;②市場データ実験;③バックテストで示した • バックテストの結果 • チューニングパラメータセットごとにパフォーマンスを計測 • 最良 R/R は 0.78 • 同戦略は株式との相関が -5.4% • 同戦略は債券先物との相関が +7.6% 27 序論 ロバスト 相関 数値実験 バック テスト 結論 補論
本報告のアウトライン ⚫ 序論 ⚫ 頑健な相関評価指標 ⚫ 数値実験 ⚫ バックテスト ⚫
結論 ⚫ 補論 28 序論 ロバスト 相関 数値実験 バック テスト 結論 補論
特徴量重要度 予測に寄与した特徴量の傾向 • 最良の R/R を示したチューニングパラメータセットについて調べる • 各モデルについてSHAP値から特徴量重要度を計算 • 重要度が高い上位
5本 の特徴量をモデル別にカウントする 29 序論 ロバスト 相関 数値実験 バック テスト 結論 補論 ファクターモメンタムの 再発見をしているわけではない 景気サイクル テクニカル
推論結果から構成されるポジション リスクポジションの推移 • 上昇ラベルまたは下落ラベルかのいずれかに注目したとき, 20営業日連続で推論結果が 1 となったときに日率 1% リスクを取得することになる •
例として,最小分散ファクターのリスクポジションの推移を以下に示す 30 序論 ロバスト 相関 数値実験 バック テスト 結論 補論 上昇ラベルと下落ラベルがともに 1 と推論され リスクポジションが打ち消し合うことも