Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250508_空間データと回帰分析
Search
t_akaike
May 01, 2025
0
78
20250508_空間データと回帰分析
t_akaike
May 01, 2025
Tweet
Share
More Decks by t_akaike
See All by t_akaike
tidyterraを使ってみる
t_akaike
0
510
Featured
See All Featured
We Have a Design System, Now What?
morganepeng
52
7.6k
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3.2k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
780
Rails Girls Zürich Keynote
gr2m
94
13k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
30
2.3k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
Rebuilding a faster, lazier Slack
samanthasiow
81
9k
How to train your dragon (web standard)
notwaldorf
91
6k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
2.9k
Building a Modern Day E-commerce SEO Strategy
aleyda
40
7.2k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Into the Great Unknown - MozCon
thekraken
38
1.8k
Transcript
AI 2025.05.08 AI技術開発部 分析グループ / 赤池 嵩文 GO株式会社 空間データと回帰分析
© GO Inc. 2 ⾃⼰紹介 【経歴】 ERPパッケージのベンダーにてシステム開発を経験した後、企業の信 ⽤調査会社へ⼊社しデータ分析業務を開始。 それ以後、AIベンダー、HR系ベンチャー、薬局系スタートアップに て分析業務を担当し、2024年6⽉にGO株式会社に⼊社した。
@takaike12 GO株式会社 AI技術開発部 分析グループ / ⾚池 嵩⽂
AI 3 目次 01|はじめに 02|空間計量経済学と回帰分析 03|地球統計学と回帰分析 04|まとめ 02|空間的自己相関と空間的異質性
AI 4 01 はじめに
AI 【この資料の目的】 ▪ 短時間で空間データを用いた回帰分析の全体像をざっと掴むこと → 応用的な内容は扱いません 【資料の流れ】 ▪ 自分が学習する中で疑問に思ったことを中心に、Q&A形式で進めていきます 5
はじめに
AI 6 02 空間的自己相関と空間的異質性
AI 空間データの特徴 7 ▪ A. 目的変数が近くの値と似ている(似ていない)傾向や、場所そのものによ る目的変数の値の違いが考慮されないため、そういった要素が推定誤差に残っ てしまう Q. 空間データで単回帰・重回帰分析を行うと何か困るの?
空間的自己相関 場所による値の違いのこと → 目的変数が大きい「領域」なのか、近隣の 値が大きい場所につられて他の場所より大き い(空間的自己相関)のかを区別するのが難 しい 説明 空間的異質性 「統計ライブラリー 空間統計学 ―自然科学から人文・社会 科学まで―」P.21より引用 距離が近いほど値が似ている or 似ていない こと
AI ▪ A. 距離が近いほど値が似ている(似ていない)傾向のこと ▪ 近いほど似ている = 正の空間的自己相関 ▪ 近いほど似てない
= 負の空間的自己相関 8 Q. 「空間的自己相関」って何? 正の空間的自己相関の 例 負の空間的自己相関の 例
AI ▪ A. 空間全域の傾向把握のためのGISA、空間の中でのホットスポット・コール ドスポットの把握のためのLISAに大別される LISA (Local indicators of spatial
association) 9 Q. 空間的自己相関の指標にはどんなものがある? やりたいこと 空間全域の傾向把握 モランのI統計量、ギアリーのC統計量 確認する指標 ローカル・モラン統計量、 Gi, Gi*統計量 空間の中で正・負の相 関が大きい場所の把握 指標の総称 GISA (Global indicators of spatial association)
AI ▪ A. 各種統計量の値の比較だけでなく、検定によって確かめることもできる ▪ 検定の例: モランのI統計量 10 Q. 「空間的自己相関」の有無をどうやって確認する?
指標に漸近正規性を仮定し、 Z統計量を算出 & 検定!
AI 「普遍型クリギング」などの手法を用いる ※ 「空間的自己相関」「空間的異質性」は、目的 変数間の距離などで定義されるバリオグラムで 表現 ▪ A. 空間計量経済学と地球統計学のいずれの方法を使うかによって、方向性が 異なる
11 Q. 「空間的自己相関」「空間的異質性」を考慮したモデルって? 分野 空間計量経済学 空間ラグモデル、空間誤差モデル など 手法 普遍型クリギングなど 地球統計学 方向性 回帰モデルに対し、空間の隣接性を表す 「空間重み行列」を組み込む
AI 12 03 空間計量経済学と回帰分析
AI 1 2 4 ▪ A. 行政区やポリゴンなどの領域ごとに、「隣」を1、そうでない領域を0とし た行列のことで、基準化して使われることが非常に多い ▪ 「隣」
= 接している領域だけを隣とみなすのではなく、距離がある閾値以下や最 近傍など、分析時に検討の余地あり 13 Q. 「空間重み行列」って何? 領域の例 空間重み行列 (隣接行列) 空間重み行列 (基準化) 3
AI 14 Q. 空間重み行列をどうやってモデルに組み込む? ▪ A. モデルの変数に掛ける ▪ 空間的自己相関が何と関連しているか?という仮定次第で、空間重み行 列がどこに掛かるかが変わる
モデル 空間ラグモデル (SLM) 式 空間誤差モデル (SEM) 備考 ARモデルのような形で空間的自己相関が目 的変数に影響するモデル。 一般的な手法。 空間Durbinモデ ル (SDM) 空間的自己相関が、誤差を通じて目的変数 に影響するモデル。 一般的な手法。 空間ラグモデルに対し、説明変数の空間的 自己相関を組み込んだモデル。
AI 15 04 地球統計学と回帰分析
AI 「空間的自己相関」「空間的異質性」の扱い ▪ A. データの粒度、「空間的自己相関」や「空間的異質性」の扱い、興味の 対象が異なる 16 Q. 空間計量経済学のモデルと何が違うの? 地点
(空間的領域 = 連続) 分野 空間計量経済学 説明 予測(※) (空間的内挿) 興味の対象 地球統計学 データの粒度 地域 (空間的領域 = 離散) バリオグラムや共分散関数で表現 → ある条件のもとでの、 2点間の距離の みで定義される値の差分の分散や、 2点 の値の共分散 空間重み行列を活用 ※ 「クリギング」という手法は、元々は鉱山技術者のダニー・クリーグが鉱物の総量を予測する方法として開発
AI Q. 地球統計学の回帰モデルってどんな形? ▪ A. 空間過程 Y(s) を以下の形で表現したモデル(普遍型クリギング) ▪ 17
大域的なトレンド成分 局所的な変動成分 (観測値の間隔よりも短い範囲での変 動) 誤差 変数の内容 変数 トレンド成分を既知変数の線型結合で表現 (位置座標の関数以外の変数も含められ、 その場合「回帰クリギング」とも呼ばれる) 普遍型クリギングの空間過程の導出 平滑成分 (共分散関数、バリオグラムによる空間 的自己相関の成分) ここで とすると
AI 18 05 まとめ
AI 【空間的自己相関と空間的異質性】 ▪ 空間データに単回帰分析や重回帰分析を行うと、周辺との類似(空間的自己相関)や地点による 違い(空間的異質性)といった空間データの特性が推定誤差に乗ってしまう ▪ 空間統計学には空間計量経済学や地球統計学などの分野が存在し、分野ごとにモデルへの「空間的 自己相関」や「空間的異質性」の表現が異なる 【空間計量経済学】 ▪
対象とする全ての領域に対して、各領域と隣り合っているかどうかを総当たりで判定した行列を 「空間重み行列」という ▪ 一般的な手法として「空間ラグモデル」や「空間誤差モデル」がある 【地球統計学】 ▪ 空間計量経済学のモデルとは、データの粒度や「空間的自己相関」「空間的異質性」の扱い、 興味の対象が異なる ▪ 「回帰」に限定すると、説明変数を組み込んだ「普遍型クリギング」というモデルがある 19 まとめ
AI ▪ 瀬谷 創, 堤 盛人「統計ライブラリー 空間統計学 ―自然科学から人文・社会科学まで―」, 朝倉書店, 2014年3月
▪ ジュセッペ・アルビア (著), 堤 盛人 (監修)「Rで学ぶ空間計量経済学入門」, 勁草書房, 2016年9月 ▪ 持橋 大地, 大羽 成征「ガウス過程と機械学習 (機械学習プロフェッショナルシリーズ)」, 講談社, 2019年3月 20 Reference