Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20250508_空間データと回帰分析

Avatar for t_akaike t_akaike
May 01, 2025
78

 20250508_空間データと回帰分析

Avatar for t_akaike

t_akaike

May 01, 2025
Tweet

Transcript

  1. AI 空間データの特徴 7 ▪ A. 目的変数が近くの値と似ている(似ていない)傾向や、場所そのものによ る目的変数の値の違いが考慮されないため、そういった要素が推定誤差に残っ てしまう Q. 空間データで単回帰・重回帰分析を行うと何か困るの?

    空間的自己相関 場所による値の違いのこと → 目的変数が大きい「領域」なのか、近隣の 値が大きい場所につられて他の場所より大き い(空間的自己相関)のかを区別するのが難 しい 説明 空間的異質性 「統計ライブラリー 空間統計学 ―自然科学から人文・社会 科学まで―」P.21より引用 距離が近いほど値が似ている or 似ていない こと
  2. AI ▪ A. 距離が近いほど値が似ている(似ていない)傾向のこと ▪ 近いほど似ている = 正の空間的自己相関 ▪ 近いほど似てない

    = 負の空間的自己相関 8 Q. 「空間的自己相関」って何? 正の空間的自己相関の 例 負の空間的自己相関の 例
  3. AI ▪ A. 空間全域の傾向把握のためのGISA、空間の中でのホットスポット・コール ドスポットの把握のためのLISAに大別される LISA (Local indicators of spatial

    association) 9 Q. 空間的自己相関の指標にはどんなものがある? やりたいこと 空間全域の傾向把握 モランのI統計量、ギアリーのC統計量 確認する指標 ローカル・モラン統計量、 Gi, Gi*統計量 空間の中で正・負の相 関が大きい場所の把握 指標の総称 GISA (Global indicators of spatial association)
  4. AI 「普遍型クリギング」などの手法を用いる ※ 「空間的自己相関」「空間的異質性」は、目的 変数間の距離などで定義されるバリオグラムで 表現 ▪ A. 空間計量経済学と地球統計学のいずれの方法を使うかによって、方向性が 異なる

    11 Q. 「空間的自己相関」「空間的異質性」を考慮したモデルって? 分野 空間計量経済学 空間ラグモデル、空間誤差モデル など 手法 普遍型クリギングなど 地球統計学 方向性 回帰モデルに対し、空間の隣接性を表す 「空間重み行列」を組み込む
  5. AI 1 2 4 ▪ A. 行政区やポリゴンなどの領域ごとに、「隣」を1、そうでない領域を0とし た行列のことで、基準化して使われることが非常に多い ▪ 「隣」

    = 接している領域だけを隣とみなすのではなく、距離がある閾値以下や最 近傍など、分析時に検討の余地あり 13 Q. 「空間重み行列」って何? 領域の例 空間重み行列 (隣接行列) 空間重み行列 (基準化) 3
  6. AI 14 Q. 空間重み行列をどうやってモデルに組み込む? ▪ A. モデルの変数に掛ける ▪ 空間的自己相関が何と関連しているか?という仮定次第で、空間重み行 列がどこに掛かるかが変わる

    モデル 空間ラグモデル (SLM) 式 空間誤差モデル (SEM) 備考 ARモデルのような形で空間的自己相関が目 的変数に影響するモデル。 一般的な手法。 空間Durbinモデ ル (SDM) 空間的自己相関が、誤差を通じて目的変数 に影響するモデル。 一般的な手法。 空間ラグモデルに対し、説明変数の空間的 自己相関を組み込んだモデル。
  7. AI 「空間的自己相関」「空間的異質性」の扱い ▪ A. データの粒度、「空間的自己相関」や「空間的異質性」の扱い、興味の 対象が異なる 16 Q. 空間計量経済学のモデルと何が違うの? 地点

    (空間的領域 = 連続) 分野 空間計量経済学 説明 予測(※) (空間的内挿) 興味の対象 地球統計学 データの粒度 地域 (空間的領域 = 離散) バリオグラムや共分散関数で表現 → ある条件のもとでの、 2点間の距離の みで定義される値の差分の分散や、 2点 の値の共分散 空間重み行列を活用 ※ 「クリギング」という手法は、元々は鉱山技術者のダニー・クリーグが鉱物の総量を予測する方法として開発
  8. AI Q. 地球統計学の回帰モデルってどんな形? ▪ A. 空間過程 Y(s) を以下の形で表現したモデル(普遍型クリギング) ▪ 17

    大域的なトレンド成分 局所的な変動成分 (観測値の間隔よりも短い範囲での変 動) 誤差 変数の内容 変数 トレンド成分を既知変数の線型結合で表現 (位置座標の関数以外の変数も含められ、 その場合「回帰クリギング」とも呼ばれる) 普遍型クリギングの空間過程の導出 平滑成分 (共分散関数、バリオグラムによる空間 的自己相関の成分) ここで          とすると
  9. AI 【空間的自己相関と空間的異質性】 ▪ 空間データに単回帰分析や重回帰分析を行うと、周辺との類似(空間的自己相関)や地点による 違い(空間的異質性)といった空間データの特性が推定誤差に乗ってしまう ▪ 空間統計学には空間計量経済学や地球統計学などの分野が存在し、分野ごとにモデルへの「空間的 自己相関」や「空間的異質性」の表現が異なる 【空間計量経済学】 ▪

    対象とする全ての領域に対して、各領域と隣り合っているかどうかを総当たりで判定した行列を 「空間重み行列」という ▪ 一般的な手法として「空間ラグモデル」や「空間誤差モデル」がある 【地球統計学】 ▪ 空間計量経済学のモデルとは、データの粒度や「空間的自己相関」「空間的異質性」の扱い、 興味の対象が異なる ▪ 「回帰」に限定すると、説明変数を組み込んだ「普遍型クリギング」というモデルがある 19 まとめ
  10. AI ▪ 瀬谷 創, 堤 盛人「統計ライブラリー 空間統計学 ―自然科学から人文・社会科学まで―」, 朝倉書店, 2014年3月

    ▪ ジュセッペ・アルビア (著), 堤 盛人 (監修)「Rで学ぶ空間計量経済学入門」, 勁草書房, 2016年9月 ▪ 持橋 大地, 大羽 成征「ガウス過程と機械学習 (機械学習プロフェッショナルシリーズ)」, 講談社, 2019年3月 20 Reference