Upgrade to Pro — share decks privately, control downloads, hide ads and more …

大規模言語モデルを用いたニュースデータのセンチメント判定モデルの開発および実体経済センチメント...

s-noma
January 08, 2025

 大規模言語モデルを用いたニュースデータのセンチメント判定モデルの開発および実体経済センチメントインデックスの構成

日本ファイナンス学会 第6回秋季研究大会 報告資料
https://nfa-net.jp/report/3274-2/
予稿:
https://nfa-net.jp/wp-content/uploads/2024/11/000046-005.pdf

s-noma

January 08, 2025
Tweet

More Decks by s-noma

Other Decks in Research

Transcript

  1. 大規模言語モデルを用いた ニュースデータのセンチメント判定モデルの開発 および 実体経済センチメントインデックスの構成 2024年11月9日 Japan Digital Design株式会社 MUFG AI

    Studio 野間 修平 1 本報告の内容は筆者に帰属し,所属する組織としての見解を示すものではない. また,本報告にある誤りは全て筆者の責に帰する. 日本ファイナンス学会 第6回秋季研究大会 報告資料
  2. 本報告のアウトライン ⚫ 序論 ⚫ 提案手法 ⚫ センテンスの抽出 ⚫ マクロ経済トピックの判定 ⚫

    センチメントの判定 ⚫ 数値実験 ⚫ 結論 ⚫ 補論 3 序論 センテンス 抽出 トピック 判定 センチ メント判定 数値実験 結論 補論
  3. 先行研究 金融ドメインにおけるニュースデータの活用 • 活用の目的は3種に大別される 1. 実体経済の様子を捉える高頻度な指標を構成⋅1 • 経済指標の算出はコストが高く,公表頻度も月次 • ニュースは日次で算出可能

    • 意思決定への活用 2. 経済指標の予測因子を構成⋅2 3. 市場分析への応用⋅3 (予測,要因分解) 4 序論 センテンス 抽出 トピック 判定 センチ メント判定 数値実験 結論 補論 1 (Nguyen et al. 2020), (Shapiro et al. 2022), (Seki et al. 2022) 2 (Barbaglia et al. 2023), (Ashwin et al. 2021) 3 (Oritz 2023), (Beetsma et al.2013), (Sayer 2018)
  4. 先行研究 センチメントの判定方法 • 辞書ベース⋅1 : 古くは単語と極性が紐づけられた辞書を用意して判定 • ルールベース⋅2: 辞書の情報 +

    否定などの構文を考慮 • 機械学習ベース ➢ 大規模言語モデルなどを用いて判定 ➢ より複雑な構文や文脈を考慮することが可能 ➢ 事前にセンチメント判定用の辞書を構成する必要がない 5 序論 センテンス 抽出 トピック 判定 センチ メント判定 数値実験 結論 補論 1 (Sebastiani and Esuli 2006), (Loughran and McDonald 2011) 2 (Hutto and Gilbert 2014)
  5. センチメントインデックスの構成方法 ニュースからセンチメントインデックスを構成するまでの流れ 7 序論 センテンス 抽出 トピック 判定 センチ メント判定

    数値実験 結論 補論 ニュース本文 センテンス キーワードを含むセンテンス マクロ経済トピックに言及するセンテンス センチメント 本文の前処理とセンテンスの抽出 キーワードによる絞り込み LLMを用いたトピック判定による絞り込み LLMを用いたセンチメントの判定 トピック判定に 基づく センテンスの抽出
  6. 本報告のアウトライン ⚫ 序論 ⚫ 提案手法 ⚫ センテンスの抽出 ⚫ マクロ経済トピックの判定 ⚫

    センチメントの判定 ⚫ 数値実験 ⚫ 結論 ⚫ 補論 8 序論 センテンス 抽出 トピック 判定 センチ メント判定 数値実験 結論 補論
  7. 使用するニュースデータ 使用するニュースデータ = Reutersニュース • 1996年から2023年までに公表された約1400万記事⋅1を分析対象とした • ストーリー • Reutersが用意するニュース記事の改訂履歴を管理する概念

    • 改訂が多いストーリーに属する記事にセンチメントを判定するセンテンスが 偏ることを避けるべく,各ストーリーにつき1つの記事を分析対象とする 9 序論 センテンス 抽出 トピック 判定 センチ メント判定 数値実験 結論 補論 1 本文が存在し,英語で執筆されたもの. 24/11/07 24/11/08
  8. センテンスの抽出 ニュース本文からセンテンスを抽出する意義 • 不要な情報の排除 • 記事中にはヘッダー,フッター,タグ,表など 記事が報じる事象とは直接的な関係がない文字列が含まれる • 相異なるセンチメントの存在 •

    例えば,足元の労働市場に関して多角的に論じている記事を考える • 記事中のセンテンスが全て同一のセンチメントを持つとは考えにくい • 単一のセンチメントを持つことを期待してセンテンスへ分割する⋅1 10 序論 センテンス 抽出 トピック 判定 センチ メント判定 数値実験 結論 補論 1 もちろん1文中に相反するセンチメントに対応する表現が含まれることもある.
  9. 本報告のアウトライン ⚫ 序論 ⚫ 提案手法 ⚫ センテンスの抽出 ⚫ マクロ経済トピックの判定 ⚫

    センチメントの判定 ⚫ 数値実験 ⚫ 結論 ⚫ 補論 12 序論 センテンス 抽出 トピック 判定 センチ メント判定 数値実験 結論 補論
  10. 2段階目のトピックの判定手法 LLMによるトピックの判定 • RoBERTaをファインチューニングすることにより 「マクロ経済」トピックに言及しているか否かを判定するモデルを得る • 訓練データはどのように用意するか → GPT-4 Turboを用いてアノテーションを行う

    15 序論 トピック 判定 センチ メント判定 数値実験 結論 補論 キーワードを含むセンテンス 一部を抽出 GPT-4 Turbo アノテーション 訓練データ ファインチューニング RoBERTa センテンス 抽出
  11. 本報告のアウトライン ⚫ 序論 ⚫ 提案手法 ⚫ センテンスの抽出 ⚫ マクロ経済トピックの判定 ⚫

    センチメントの判定 ⚫ 数値実験 ⚫ 結論 ⚫ 補論 17 序論 センテンス 抽出 トピック 判定 センチ メント判定 数値実験 結論 補論
  12. 既存の金融特化LLMを用いる問題点 金融特化LLMによって実体経済センチメントを判定する問題点 • 金融ドメインの文章は語彙や表現に特異性がみられる → 多くの金融特化LLMが提案されている • しかし,金融特化LLMの事前学習に用いられるデータセットは 株価に対する影響に基づいてアノテートされているものが多い •

    株価に対するセンチメントと実体経済に対するセンチメントが 相異なるケースが考えられる → 本研究では汎用モデルを選択 18 序論 トピック 判定 センチ メント判定 数値実験 結論 補論 仕入れ価格の 下落 物価動向 株価 株価 労働市場 レイオフ Neg Pos Neg Pos センテンス 抽出
  13. センチメント判定モデルの学習 LLMによるセンチメント判定 • 「マクロ経済トピック」判定モデルと同様の手続きでRoBERTaを ファインチューニングする 19 序論 トピック 判定 センチ

    メント判定 数値実験 結論 補論 「マクロ経済トピック」と判定されたセンテンス 一部を抽出 GPT-4 Turbo アノテーション 訓練データ ファインチューニング RoBERTa センテンス 抽出
  14. プロンプト(物価動向) 物価動向に関するセンチメントを判定するプロンプト • ポイント ➢ ラベル名を “HIGH” のように定義を表象するものに( “Label_1”) ➢

    中立ラベルを具体的に定義(変化が小さい or 相反するものを含む) ➢ “estimated from” なる表現を用いて積極的に推論させる ➢ Accuracy は 86.6% 20 序論 トピック 判定 センチ メント判定 数値実験 結論 補論 センテンス 抽出
  15. 労働市場に関するセンチメントを判定するプロンプト • ポイント ➢ 物価動向と同様(”TIGHT”, “LOOSE”, “NEUTRAL”) • Accuracy は

    81.3% プロンプト(労働市場) 21 序論 トピック 判定 センチ メント判定 数値実験 結論 補論 センテンス 抽出
  16. 本報告のアウトライン ⚫ 序論 ⚫ 提案手法 ⚫ センテンスの抽出 ⚫ マクロ経済トピックの判定 ⚫

    センチメントの判定 ⚫ 数値実験 ⚫ 結論 ⚫ 補論 22 序論 センテンス 抽出 トピック 判定 センチ メント判定 数値実験 結論 補論
  17. センチメントインデックスとマインドデータの連動性 • 物価動向インデックスはISM支払い価格指数と連動(相関:76.9%) • 労働市場インデックスはISM雇用指数と連動(相関:63.7%) インデックスと指標の連動性② 25 序論 トピック 判定

    センチ メント判定 数値実験 結論 補論 センテンス 抽出 ISM:ISM製造業景況感指数.米国の企業に対して景況感に関するアンケートを行い,その結果を要約した指数.
  18. センチメントインデックスは経済指標の予測因子として有用か? • 予測因子としての有用性をどのように示すか → 変数選択 • L1正則化を施した線形予測モデルを学習し,正則化を強めても インデックスが非0の回帰係数を持つことを確認する • 予測対象:ISM支払い価格指数

    • 予測モデル • 外れ値の存在を勘案し,中央値回帰モデルを採用する 予測因子としての有用性① 26 序論 トピック 判定 センチ メント判定 数値実験 結論 補論 センテンス 抽出 ℒ 𝛼, 𝛽 𝜆 = ෍ 𝑡 𝑦𝑡 − 𝛼 + 𝛽⊤𝑥𝑡 + 𝜆 ⋅ 𝛽 1
  19. 本報告のアウトライン ⚫ 序論 ⚫ 提案手法 ⚫ センテンスの抽出 ⚫ マクロ経済トピックの判定 ⚫

    センチメントの判定 ⚫ 数値実験 ⚫ 結論 ⚫ 補論 31 序論 センテンス 抽出 トピック 判定 センチ メント判定 数値実験 結論 補論
  20. 結論 本研究のまとめ • ニュースから物価動向と労働市場に対するセンチメントを判定して定量化 • センチメントインデックスを構成するプロセス: ➢ センテンスの抽出 ➢ キーワードによるトピックの判定

    ➢ LLMによるトピック判定 ➢ LLMによるセンチメントの判定 • センチメントインデックスの有用性: ➢ 経済指標との連動性が高い高頻度の指標 ➢ ISM製造業景況感指数の予測因子として有用 ➢ 債券市場におけるリバーサル相場を検出する 32 序論 センテンス 抽出 トピック 判定 センチ メント判定 数値実験 結論 補論
  21. 本報告のアウトライン ⚫ 序論 ⚫ 提案手法 ⚫ センテンスの抽出 ⚫ マクロ経済トピックの判定 ⚫

    センチメントの判定 ⚫ 数値実験 ⚫ 結論 ⚫ 補論 33 センテンス 抽出 トピック 判定 センチ メント判定 数値実験 結論 補論 序論
  22. タグを用いたトピック判定 タグを用いたトピック判定 • 本研究ではキーワードとLLMを用いてセンテンスのトピックを判定 • 一方,Reutersニュースでは記事にタグが紐づけられている • 地域(米国,新興国,etc.) • 資産クラス(株,為替,etc.)

    • トピック(中央銀行,地政学,etc.) • 用意されたマクロ経済トピックのタグを用いればよいのでは? • タグを用いる問題点 = 検出漏れのリスク • マクロ経済タグが付されていない記事中にも経済に言及するセンテンスが 34 序論 センテンス 抽出 トピック 判定 センチ メント判定 数値実験 結論 補論
  23. ファインチューニングの意義 GPT-4 Turboを用いてセンチメントを判定しない理由 • 本研究では GPT-4 Turbo を用いてファインチューニングに用いる 訓練データのアノテーションを行っている •

    なぜ全てのセンテンスに対して GPT-4 Turbo を用いてセンチメントを 判定しないのか? → コスト • 1996年から2023年の28年間において,センチメントの判定対象となる センテンスは 5,381,440文 • 入出力の平均トークン長から費用を概算するとおよそ 350万円 35 序論 センテンス 抽出 トピック 判定 センチ メント判定 数値実験 結論 補論
  24. センチメントインデックスのバイアス センチメントインデックスが正のバイアスを有している理由 • センチメントインデックスの平均値: • 物価動向:16.7% • 労働市場: 1.7% •

    正のバイアスを持つのはなぜか? → 物価も雇用者数も上昇基調 36 序論 センテンス 抽出 トピック 判定 センチ メント判定 数値実験 結論 補論