Upgrade to Pro — share decks privately, control downloads, hide ads and more …

マケデコ プログラミングに頼らないExcelシートと生成AIによる日本株データ分析 発表資料

tomo
August 09, 2024

マケデコ プログラミングに頼らないExcelシートと生成AIによる日本株データ分析 発表資料

tomo

August 09, 2024
Tweet

More Decks by tomo

Other Decks in Programming

Transcript

  1. 1 © 2022 JPX Market Innovation & Research, Inc. •

    近日中に先物・オプション(日経225オプション以外)の新規APIをリリースいたします。 • 当該APIはPremiumプランへ追加予定です。具体的な追加対象銘柄は以下のとおりです。 J-Quants APIのアップデートについて 対象銘柄(先物) 取得可能期間 TOPIX先物 2008年5月7日〜 日経225先物、日経225mini先物 2008年5月7日〜 長期国債先物 2008年5月7日〜 ミニTOPIX先物 2008年6月16日〜 東証REIT指数先物 2008年6月16日〜 日経平均・配当指数先物 2010年7月26日〜 日経平均VI先物 2012年2月27日〜 NYダウ先物 2012年5月28日〜 JPX日経インデックス400先物 2014年11月25日〜 マザーズ先物 2016年7月19日〜 日経225マイクロ先物 2023年5月29日〜 TONA3ヶ月金利先物 2023年5月29日〜 • リリース時にはマケデコのDiscordや Twitter等で別途告知させていただきます。 • また、今後も新規のAPI追加を計画しており ますので、そちらも続報をお待ち下さい! 対象銘柄(OP) 取得可能期間 TOPIXオプション 2008年5月7日〜 長期国債先物オプション 2008年5月7日〜 有価証券オプション 2014年11月17日〜 日経225miniオプション 2023年5月29日〜
  2. STRICTLY CONFIDENTIAL 本日のアジェンダ 3 時間 タイトル 内容 19:00 はじめに 本取り組みの説明とスポンサーであるSBIネオトレード証券の紹介をしま

    す。 19:15 Excelシートの機能説明と設計の説 明 Excelシートの機能の説明と設計を解説します。また、内部で利⽤している J-Quants APIとネオトレAPI for Excelの説明をします。参加者はこのセッ ションを⾒ることで、Excelシートの基本的な利⽤⽅法を学ぶことができま す。 19:45 Excelシートの活⽤⽅法 過去セミナー「テンバガーはデータ分析で⾒つかるのか?」で議論された題 材をベースに、セミナーで紹介されたスクリーニングを実際にどのように⾏ うかを⾒せながら活⽤⽅法を紹介します。このセッションでは応⽤的な内容 を取扱います。 20:15 UKIさんセッション「Excelシートで ⽣成したCSVデータを利⽤して⽣成 AIで遊んでみた」 Excelシートで作成したCSVデータを⽣成AIでいろいろ分析してみた事例を紹 介いただきます。 20:30 UKIさんを交えてパネルディスカッ ション 北⼭がExcelシートと⽣成AIの活⽤に関する簡単なラップアップを⾏い、ここ までの内容の質疑応答を⾏います。質問はマケデコDiscordで募集します。 
  3. STRICTLY CONFIDENTIAL 今回の取り組みについて 5 これまでの取り組み • AMA 4回(UKIさん、中川慧さん、yoshisoさん、駄⽝さん、いもすさん) • セミナー15回

    • ハッカソン開催 ◦ J-Quantsリリース記念ハッカソン、LT⼤会の開催 今後の活動⽅針 • ⾦融‧トレードの最先端トピックを扱うという基本はキープする • 多くの⼈にもっと⾯⽩い発表をしてもらう ◦ 2024のセミナーは概ねこの⽅向で開催 • ⽣成AIとテーブルデータ(CSV)の活⽤を次の活動の視野に ◦ ただし、この活動はデータ取得⽅法をより簡便にする必要がある マケデコ 年末座談会で運用メンバーと今後 活動についていろいろ話しま した 興味ある方 こちらで公開済み
  4. STRICTLY CONFIDENTIAL 株式会社SBIネオトレード証券のご紹介 本セミナー 株式会社 SBIネオトレード証券 スポンサーにより開催されております。マケデコ 趣旨に賛同いた だき、スポンサーいただいた株式会社 SBIネオトレード証券

    皆様に感謝致します。 SBIネオトレード証券 1948年創業 更栄証券を源流とした 70年以上 歴史がある証券会社です。 ネット証券 中で 小規模ですが、信用取引 取引手数料を 2019年12月に他社に先駆けて完全無料化を行う など、先鋭的な取り組みで投資家 支持を集めております。 同社 国内株 信用取引に注力をしており、制度信用取引 買方金利が通常時で 2.30%、貸株料も1.10%と ネット証券 中でも最低水準で、アクティブな投資家に好評 証券会社です。 2024年3月に「ネオトレAPI for Excel」をリリースし、本セミナーで配布される Excelシート内で、同機能を通じてリ アルタイム 株価情報等を取得することができます。 「ネオトレAPI for Excel」で 、Excel関数 入力を行うことなく、取得したい項目やソート順、表示数などを選択す るだけで、株価情報やランキング情報、注文照会などを呼び出すことができる簡易ダイヤログ機能も搭載されて おります。VBA 知識がある方であれ 、投資ルールに沿った自動発注などを実現することもできます で、是 非お試しください。 6
  5. STRICTLY CONFIDENTIAL 今回の取り組みについて 7 これまでの取り組み • AMA 4回(UKIさん、中川慧さん、yoshisoさん、駄⽝さん、いもすさん) • セミナー15回

    • ハッカソン開催 ◦ J-Quantsリリース記念ハッカソン、LT⼤会の開催 今後の活動⽅針 • ⾦融‧トレードの最先端トピックを扱うという基本はキープする • 多くの⼈にもっと⾯⽩い発表をしてもらう ◦ 2024のセミナーは概ねこの⽅向で開催 • ⽣成AIとテーブルデータ(CSV)の活⽤を次の活動の視野に ◦ ただし、この活動はデータ取得⽅法をより簡便にする必要がある マケデコ 年末座談会で運用メンバーと今後 活動についていろいろ話しま した 興味ある方 こちらで公開済み
  6. STRICTLY CONFIDENTIAL 本日のアジェンダ 8 時間 タイトル 内容 19:00 はじめに 本取り組みの説明とスポンサーであるSBIネオトレード証券の紹介をしま

    す。 19:15 Excelシートの機能説明と設計の説 明 Excelシートの機能の説明と設計を解説します。また、内部で利⽤している J-Quants APIとネオトレAPI for Excelの説明をします。参加者はこのセッ ションを⾒ることで、Excelシートの基本的な利⽤⽅法を学ぶことができま す。 19:45 Excelシートの活⽤⽅法 過去セミナー「テンバガーはデータ分析で⾒つかるのか?」で議論された題 材をベースに、セミナーで紹介されたスクリーニングを実際にどのように⾏ うかを⾒せながら活⽤⽅法を紹介します。このセッションでは応⽤的な内容 を取扱います。 20:15 UKIさんセッション「Excelシートで ⽣成したCSVデータを利⽤して⽣成 AIで遊んでみた」 Excelシートで作成したCSVデータを⽣成AIでいろいろ分析してみた事例を紹 介いただきます。 20:30 UKIさんを交えてパネルディスカッ ション 北⼭がExcelシートと⽣成AIの活⽤に関する簡単なラップアップを⾏い、ここ までの内容の質疑応答を⾏います。質問はマケデコDiscordで募集します。 
  7. STRICTLY CONFIDENTIAL マケデコExcelシートができること SBIネオトレード証券様のスポンサーにより、Python⾔語などを利⽤せずにWindowsのExcelユーザーが利⽤可能な以下の シートを開発致しました。 10 項⽬ できること 東証上場銘柄⼀覧の取得 東証上場銘柄の全リストを取得可能

    プライム‧東証のファンダメンタルデータ取得 プライム、東証の全銘柄の最⼤5年分のファンダメンタルデータを取得可能(無料プラン では2年分、12週間遅延) 個別の銘柄分析のためのファンダメンタルデー タ取得 プライム、東証の指定銘柄のファンダメンタルデータを契約プランの最⼤の⻑さまで取 得可能(最⼤はプレミアムが2008年から) テンプレートに分析内容を記載して銘柄分析を 各銘柄に適⽤する 特定銘柄に対してファンダメンタルデータを取得し、⾃分でテンプレートに設定した分 析をワンクリックで実施可能 スクリーニング機能の提供 FYの決算情報をベースにこれまでマケデコでも議論になったさまざまなスクリーニング の実施が可能(Q1-Q3の情報は未対応)
  8. STRICTLY CONFIDENTIAL 本日のアジェンダ 13 時間 タイトル 内容 19:00 はじめに 本取り組みの説明とスポンサーであるSBIネオトレード証券の紹介をしま

    す。 19:15 Excelシートの機能説明と設計の説 明 Excelシートの機能の説明と設計を解説します。また、内部で利⽤している J-Quants APIとネオトレAPI for Excelの説明をします。参加者はこのセッ ションを⾒ることで、Excelシートの基本的な利⽤⽅法を学ぶことができま す。 19:45 Excelシートの活⽤⽅法 過去セミナー「テンバガーはデータ分析で⾒つかるのか?」で議論された題 材をベースに、セミナーで紹介されたスクリーニングを実際にどのように⾏ うかを⾒せながら活⽤⽅法を紹介します。このセッションでは応⽤的な内容 を取扱います。 20:15 UKIさんセッション「Excelシートで ⽣成したCSVデータを利⽤して⽣成 AIで遊んでみた」 Excelシートで作成したCSVデータを⽣成AIでいろいろ分析してみた事例を紹 介いただきます。 20:30 UKIさんを交えてパネルディスカッ ション 北⼭がExcelシートと⽣成AIの活⽤に関する簡単なラップアップを⾏い、ここ までの内容の質疑応答を⾏います。質問はマケデコDiscordで募集します。 
  9. STRICTLY CONFIDENTIAL データ分析をどのように自分の投資に活かせるか このセッションでは「データ分析をどのように⾃分の投資に活かせるか」 についてを以下の2点の観点から考察します。 • 2024年7⽉証券アナリストジャーナル「ファクター投資のパフォー マンスとバリュエーション」 • マケデコの過去の発表を分析したうえでわかる気をつけるポイント

    これまでマケデコで扱ったきたトピックは、理解が難しい概念が多かった のですが、初⼼者にもできるだけわかりやすく説明してみます。 最終的には「どのようなポートフォリオを組むと期待値が上る可能性があ るか、下がる可能性があるか」を議論したいと思います。 ただし、わかりにくかったら申し訳ありません! 14
  10. STRICTLY CONFIDENTIAL ファクター投資のパフォーマンスとバリュエーション 15 2024年7⽉にファクター投資の⼤家であるロバート‧アーノット⽒の論⽂が証券アナリストジャーナルに掲載 注意: ここで述べているのは「⽶国、先進国、 新興国の各15ファクターから構成される45ファクター」であり、⽇本株のみ をさしているわけではない。この論⽂で述べられているチェックポイントは主に以下の5つですが、データ分析経験者ではな いと理解が難しい。

    1. 相対バリュエーション指標(株価∕売上⾼、株価∕キャッシュフロー、株価∕純資産、株価∕配当など)が過去と⽐ 較して割⾼か割安かを確認する 2. ポートフォリオ全体の相対バリュエーション指標を市場と⽐較し、異常に割安または割⾼に取引されていないかを確 認する 3. ファクターやファクター投資戦略の過去のパフォーマンスが、相対的なバリュエーション⽔準の変化によるものかど うかを評価する 4. 相対バリュエーション指標とその後のパフォーマンスとの間に関連性があるかを確認する 5. 対バリュエーション指標が、上昇や下落がそれぞれ将来のパフォーマンスの良し悪しを予測する平均回帰性を⽰すか どうかを考慮する もっとわかりやすいチェックポイントをマケデコで作れないか、という試みです
  11. STRICTLY CONFIDENTIAL ファクター投資ってなに? 16 ものすごく簡単に⾔うと: 株価の値動きを何らかの変数と感応度で説明しようというアプローチ つまり、Aの株価の値動き = マーケット全体 +

    時価総額が与える影響 + PBRがあたえる影響 + XXXが与える影響 + 残り(Aの株価独⾃の値動き) のように説明できると仮定した場合、XXXに⼊る可能性があるもの。以下は代表的なものを紹介: タイプ 種別 利⽤する指数例(これもいくつかパターンがありますが計算しやすいもの) ファンダメンタル 時価総額 株価 × 発⾏済株式数 ファンダメンタル バリュー PBR = 株価 / BPS(1株あたり純資産) ファンダメンタル クオリティ ROE = EPS / BPSで計算(J-Quants APIから⼊⼿可能な情報) 株価⾃⾝ モメンタム 株価の252営業⽇間変化率 株価⾃⾝ リバーサル 株価の21営業⽇間変化率 株価⾃⾝ ボラティリティ 株価の252営業⽇間における1⽇の変化率の標準偏差(ちょっと概念が難しい)
  12. STRICTLY CONFIDENTIAL 期待される収益‧シャープレシオの期待値が上がる可 能性がある観点 期待される収益‧シャープレシオの期待値が下がる 可能性がある観点 # 観点 A ⽇本株において、ローテーションが発⽣しやすい指数(特に

    時価総額やグロース)に対して⾼い銘柄 or 低い銘柄のみで ポートフォリオを構成する B ⻑期間保有するポートフォリオでROEが低い銘柄でポート フォリオを統⼀する(⾼いROEで構成することのリスクはそ こまでは⾼くない) C 株価の直近12ヶ⽉の上昇率、ボラティリティが上位の銘柄に 投資する # 観点 D 翌年の予想ROE/予想配当利回りの上位銘柄をポートフォリ オに多めに混ぜる E ⾦(SPDR、NEXT FUNDSなどの国内ETFで可能)をポートフォ リオに混ぜる ファクター投資の論⽂で⾔われていることと、実際の⽇本株のバックテストではことなる結果を⽰すことが多いので注意が必要。 バックテストベースなので今後も続くかわからないですが、マケデコでの議論を参考に、今後も続く可能性が⾼いと考えるものを採⽤。 なお、リスクを把握して *意図的に* 傾けている⼈はそのリスクを理解していればOK。 マケデコポートフォリオチェックシート
  13. STRICTLY CONFIDENTIAL 長期間保有するポートフォリオでローテーションが発 生しやすい指数(時価総額)に対して高い銘柄 or 低い銘 柄のみでポートフォリオを構成する J-Quants API リリース1周年記念(2024/3/28)

    J-Quants APIを⽤いたファクター分析の第⼀歩 by botter_01さんよ り 「ファクター投資のパフォーマンスとバリエーション」 でも述べているが、⼀つのファクターに⼤きく⾼い‧低 いを傾けるポートフォリオは⻑期投資においてはパ フォーマンスの毀損が発⽣しやすい。 過去のマケデコにおいて、特にサイズファクター(時価総 額)において、パフォーマンスの毀損が報告されており、 かつ、リバーサルも弱い傾向があるため、時価総額は特 に危険 18 期待値低下
  14. STRICTLY CONFIDENTIAL 株価の直近12ヶ月の上昇率、ボラティリティ が上位の銘柄に投資する マケデコ Advent Calendar 2023より「新NISAでの個別株投資を考えてみる」 by UKIさんより

    • UKIさんより報告されているとくに気をつけるべきスクリーニング条件 • 毎⽉スクリーニングを実施して、その⽉に投資する • すべて相対値で評価しており、PBR1.0以上のような絶対値は利⽤しない • バックテスト期間は検証期間は2008年5⽉末⽇以降 • 特にボラティリティと上昇率上位は⽇本株では伝統的に弱いファクターなので、これらでポートフォリオを固めないように注意 • ⽶国株では上昇率上位のファクターは⼀般的に強いので注意(マーケットに寄って異なります) 20 Worst 3 条件 期待利回り 12ヶ⽉ボラティリティ上位5%(左図) 3.8% 総資産上位5% 4.0% 12ヶ⽉上昇率上位5% 4.3% 期待値低下
  15. STRICTLY CONFIDENTIAL 翌年の予想ROE/予想配当利回りの上位銘柄を ポートフォリオに多めに混ぜる マケデコ Advent Calendar 2023より「新NISAでの個別株投資を考えてみる」 by UKIさんより

    21 条件 期待利回り PBR下位5% 9.1% 期末の予想配当利回り上位5%(右上 図) 8.9% 翌年の予想ROE上位5%(右下図) 8.7% Top 3 PBR下位5%に関して 注意が必要と 泉田さんからコメントが有り 期待値上昇
  16. STRICTLY CONFIDENTIAL 翌年の予想ROE/予想配当利回りの上位銘柄を ポートフォリオに多めに混ぜる この中で抽出された期末の予想配当利回り上位5%と翌年の予想ROE上位5%について考えてみる(テンバガーはデータ分析で⾒つかるのか? (2024/04/25) 泉⽥さんの発表より) • テンバガー達成の秘訣は⾼ROE X

    継続性 • 予想ROE上位5%はそういう意味ではスクリーニング 条件として妥当 • 予想配当利回り上位は継続性のシグナルとなっている 可能性(これは要議論だが、バックテストの実績を重視) • PBR下位5%に関しては、泉⽥さんからバリュートラップ などの注意が必要とのコメントあり 22 期待値上昇
  17. STRICTLY CONFIDENTIAL 金(SPDR、NEXT FUNDSなどの国内ETF想定)をポー トフォリオに混ぜる 新NISA x データ分析イベント(2024/2/15) ポートフォリオ組 成に役⽴つよもやま話

    by yoshisoさんより ⾦ vs ⽶国債 • 株式のドローダウンをコントロールする優秀なアセッ トクラスは⾦ • ⽶債と⽶株は逆相関で補完性に優れていると⾔われて いる、が、それはここ20年程度の話 • インフレレジームか否かで相関関係は逆転。 2022年⽶ 債/⽶株で組まれたポートフォリオが⼤きく毀損 BTC • ⽶株との相関は2020年頃まで~0.2以下だったが、近年 相関は⾼まっている (0.6)。相関が低いほどポートフォ リオへの組み⼊れ資産として魅⼒的だが、 近年その魅 ⼒は減少傾向 • 過去のデータ上は⼩さい割合でもポートフォリオへ⼊ れることで収益率や シャープレシオに貢献する可能性 を⽰唆 23 金 長期間安定してドローダウンをコントロー ルしていることが観測できる 期待値上昇
  18. STRICTLY CONFIDENTIAL データ分析をどのように活用するべきか • データ分析に反する⾏動を無意識にしないように注意する(期待値が明らかにマイナスになる条件が存在する) • 例: バックテスト上明らかに不利な条件、弱いファクターに対して⻑期間投資し続ける • データ分析を活⽤して⾃分のビューに対して適切なポートフォリオを持つこと

    • ⾃分が参加しているマーケットの特性を理解すること • 勝ち筋をデータ分析から定型化してみる。機械学習はその中の⼿法の⼀つ • どういう⼿法が⾃分にあっているかを理解する⼿助けになる。 24 ファクター分析による マーケット 特性理解 バックテストによる 過去 傾向 理解 ROE/PBR 関係による バリエーション・メカニズム 理解
  19. STRICTLY CONFIDENTIAL (付録)スクリーニングエンジンの項目 26 名前 ロジック(J-Quants API 変数名を記載) 銘柄名(部分一致) TOPIX

    100 ScaleCategoryにTOPIX Core30また TOPIX Large70を含む TOPIX 500 ScaleCategoryにTOPIX Core30また TOPIX Large70また TOPIX Mid400を含む TOPIX 1000 ScaleCategoryにTOPIX Core30また TOPIX Large70また TOPIX Mid400また TOPIX Smallを含む セクター 該当セクターを選択 時価総額(円) AdjustmentClose * NumberOfIssuedAndOutstandingSharesAtTheEndOfFiscalYearIncludingTreasuryStock PBR AdjustmentClose / BookValuePerShare PER AdjustmentClose / EarningsPerShare PCFR AdjustmentClose / (CashFlowsFromOperatingActivities / NumberOfIssuedAndOutstandingSharesAtTheEndOfFiscalYearIncludingTreasuryStock) 実績配当利回り (%) ResultDividendPerShareAnnual / AdjustmentClose * 100 実績配当性向 (%) ResultPayoutRatioAnnual 翌事業年度予想配当利回り (%) NextYearForecastDividendPerShareAnnual / AdjustmentClose * 100 翌事業年度予想配当性向 (%) NextYearForecastPayoutRatioAnnual ROE (%) EarningsPerShare / BookValuePerShare * 100 翌事業年度予想 ROE (%) NextYearForecastEarningsPerShare / BookValuePerShare * 100 ROA (%) OperatingProfit / TotalAssets * 100 営業利益率 (%) OperatingProfit / NetSales * 100 自己資本比率 (%) EquityToAssetRatio ROE 前年から 変化 (%pt) EarningsPerShare / BookValuePerShare * 100 - EarningsPerShare_1 / BookValuePerShare_1 * 100 ROA 前年から 変化 (%pt) OperatingProfit / TotalAssets * 100 - OperatingProfit_1 / TotalAssets_1 * 100 営業利益率 前年から 変化 (%pt) OperatingProfit / NetSales * 100 - OperatingProfit_1 / NetSales_1 * 100 営業利益 前年から 変化率 (%) (OperatingProfit - OperatingProfit_1) / OperatingProfit_1 * 100 売上高 前年から 変化率 (%) (NetSales - NetSales_1) / NetSales_1 * 100 直近株価 AdjustmentClose
  20. STRICTLY CONFIDENTIAL (付録) J−Quants APIのデータを扱う上での注意事項 J-Quants APIの契約プランによる取得データ期間の違い • Freeプランは直近12週間を取得できず2年間のデータが取得可能。そのため、スクリーニング機能も12週間前のデータを利⽤してじっしする ことになる

    • Liteプラン以降は直近までの最新データを取得可能。Liteプランで5年、Standardプランで10年、Premiumプランで2008年以降(現時点で約 15年分のデータ)となる FYと1Q-3Qのデータの違い • 売上⾼、営業利益、経常利益、当期純利益、⼀株あたり当期純利益、潜在株式調整後⼀株あたり当期純利益、総資産、純資産、⾃⼰資本⽐率 のような基本データは常にデータとして存在する • 以下のいくつかのデータが会計期間(1Q-3Q or FY)によって、存在するデータが変わるので、注意が必要。基本的には1Q-3Qには当期末の予想 がきて、FYには来期の予想がくると理解しておけば良い 27 (当会計期間の種類) 該当する種類にのみ存在するデータ 1Q-3Q(四半期決算) 一株あたり配当予想_期末/合計、売上高_予想_期末 営業利益_予想_期末、経常利益_予想_期末 当期純利益_予想_ 期末、一株あたり当期純利益_予想_期末、 FY(通期決算) 一株あたり配当実績_期末/合計、配当金総額/配当性向、一株あたり配当予想_翌事業年度期末/翌事業年度合計、翌事業年 度予想配当性向、売上高_予想_翌事業年度期末/翌事業年度期末、経常利益_予想_翌事業年度期末、当期純利益_予想_翌 事業年度期末、一株あたり当期純利益_予想_翌事業年度期末