Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オルタナティブデータを用いた日次経済指標の作成
Search
secondapunta
October 18, 2020
Research
0
100
オルタナティブデータを用いた日次経済指標の作成
オルタナティブデータを用いた日次経済指標の作成
https://secondapunta.shinyapps.io/report_03_20201013/
secondapunta
October 18, 2020
Tweet
Share
More Decks by secondapunta
See All by secondapunta
RとShinyで作る都営バス検索webアプリ(Tokyo.R #98)
secondapunta
1
1.1k
GDPナウキャスティング・webアプリ「NowcastingR」の概要
secondapunta
0
410
TobusR2
secondapunta
0
58
TobusR2_操作マニュアル
secondapunta
0
79
GDPナウキャスティングアプリ「Nowcaster of the seven keys」をリリースしました
secondapunta
0
360
機械学習を活用した GDP ナウキャスティング
secondapunta
0
120
機械学習を活用したコア CPI ナウキャスティング法の提案
secondapunta
0
120
Other Decks in Research
See All in Research
marukotenant01/tenant-20240826
marketing2024
0
520
ニュースメディアにおける事前学習済みモデルの可能性と課題 / IBIS2024
upura
3
680
Human-Informed Machine Learning Models and Interactions
hiromu1996
2
520
さんかくのテスト.pdf
sankaku0724
0
520
Embers of Autoregression: Understanding Large Language Models Through the Problem They are Trained to Solve
eumesy
PRO
7
1.2k
システムから変える 自分と世界を変えるシステムチェンジの方法論 / Systems Change Approaches
dmattsun
3
900
snlp2024_multiheadMoE
takase
0
460
ソフトウェア研究における脅威モデリング
laysakura
0
940
湯村研究室の紹介2024 / yumulab2024
yumulab
0
350
Leveraging LLMs for Unsupervised Dense Retriever Ranking (SIGIR 2024)
kampersanda
2
250
文献紹介:A Multidimensional Framework for Evaluating Lexical Semantic Change with Social Science Applications
a1da4
1
230
Zipf 白色化:タイプとトークンの区別がもたらす良質な埋め込み空間と損失関数
eumesy
PRO
8
1k
Featured
See All Featured
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
Gamification - CAS2011
davidbonilla
80
5.1k
Building Flexible Design Systems
yeseniaperezcruz
327
38k
Intergalactic Javascript Robots from Outer Space
tanoku
270
27k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
28
4.4k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.1k
Adopting Sorbet at Scale
ufuk
73
9.1k
A Philosophy of Restraint
colly
203
16k
Automating Front-end Workflow
addyosmani
1366
200k
Optimizing for Happiness
mojombo
376
70k
Side Projects
sachag
452
42k
Transcript
(本編は 4 ページ目から)
(本編は 4 ページ目から)
(本編は 4 ページ目から)
オルタナティブデータを用いた日次経済指標の作成 白井 洋至 2020 年 10 月 17 日 要旨
新型コロナウイルス感染症(以下、COVID-19)の拡大以降、経済分析におけ るオルタナティブデータの活用が定着しつつある。本稿では、人手の動きを表す オルタナティブデータを用いて、日次サービス消費指数を作成した。当該指数は、 日々ほぼラグなく作成可能なため、COVID-19 の状況に経済活動が大きく左右され る足許のような局面では、有用な分析手法と考えられる。 1.はじめに COVID-19 の拡大以降、経済分析におけるオルタナティブデータ1の活用が定 着しつつある。例えば、内閣府が 2020 年 4 月の月例経済報告において、個人消 費の基調判断の参考として JCB/ナウキャスト「JCB 消費 NOW」を用いたほか2、日 本銀行は、2020 年 7 月の経済・物価情勢の展望において人手の動きや夜間人口か ら、また、同年 9 月の日銀レビュー(小林ら[2020])ではクレジット・デビット カード取扱高から、COVID-19 による個人消費への影響を分析している。特に小林 ら[2020]は、「現在のように経済活動が短期間に大きく変動する局面では、景気 の現状を即時的に把握するうえで、伝統的なマクロ統計に加え、非伝統的な高頻 度データを活用することの有用性は高い」と指摘しており、こうした動きは今後 も継続すると考えられる。 オルタナティブデータの活用によって、これまで に得られた知見の一つが、人手の動きとサービス消費の相関の高さである。前述 1 2020 年 8 月 12 日付日本経済新聞は、「オルタナティブデータは、政府や企業 の公式な統計や決算とは別の新たなデータの総称。クレジットカード決済情報や スマートフォン位置情報、SNS(交流サイト)などの分析が代表例」と定義してい る。また、オルタナティブデータの活用等については、辻中[2020]や株式会社ナ ウキャストに詳しい。 2 2020 年 4 月 23 日付日本経済新聞は、「判断にあたってはナウキャスト(東 京・千代田)がまとめた JCB カードの購買データを参考にした」と報じている。 JCB 消費 NOW は、その後も消費関連指標として月例経済報告で紹介されている。
の日本銀行[2020]や大和総研[2020]は、Google「コミュニティモビリティレポート」 における小売店・娯楽施設の人手と総務省「家計調査(日別支出)」3における選 択的サービス支出(以下、サービス消費)4の推移から、外出自粛による人手の減 少が、サービス消費の減少に直結したと報告している。家計調査の公表日が当該 月終了から 1 か月以上後であるのに対し、コミュニティモビリティレポートは 日々ほぼラグなく公表されており、サービス消費の「今」を把握するには非常に 有用性の高い分析といえる5。 もっとも、当該分析は、人手やサービス消費の
「量」ではなく、ベースラインからの「変化率」を対象としたものであることに は注意が必要である。コミュニティモビリティレポートは、2020 年 1 月 3 日から 同 2 月 6 日における当該曜日の中央値をベースラインとした変化率であり、これ に合わせて、サービス消費も調整している。そのため、両者の趨勢を把握するこ とはできるが、「昨日に比べて増加/減少した」等の日単位での比較はできない6。 本稿では、こうした課題を踏まえ、日次サービス消費指数の作成を試みる。具体 的には、「量」ベースでの議論が可能な、人手の動きを表すオルタナティブデー タを検討した上で、人手の動き・サービス消費それぞれについて、カレンダー要 因(曜日・祝日)調整値を作成し、両者の関係性を考察する。 2.本稿で用いるデータ 2-1.サービス消費 サービス消費は、先行研究同様、総務省「家計調査(日別支出)」における 選択的サービス支出を用い、分析対象期間は COVID-19 の拡大が本格化した 2020 年 3 月から同年 8 月までとした。【図1】はサービス消費の推移であり、カレン ダー要因とみられる振幅はあるものの、5 月下旬の緊急事態宣言解除後は、経済 活動の再開とともに緩やかに持ち直していることが確認される。 3 二人以上の世帯の 1 世帯当たり日別・品目別消費支出 4 外食・交通・教養娯楽サービスの計 5 そのほか、JCB/ナウキャストは、JCB 消費 NOW サービス支出と外出自粛の度合 いを示す「外出の自粛率」(Stay-at-Home 指標)との相関性を指摘している。 6 Google はコミュニティモビリティレポートについて、「値が大きい方が訪問者数 が多いわけではなく、小さい方が訪問者が少ないわけでもない。日単位で変化を 比較しない。特に週末と平日を比較しない」と注意している。
2-2.人手の動き 人手の動きについては、前述の理由から Google「コミュニティモビリティレ ポート」を用いることはできない。現在、人手の動きを表すオルタナティブデー タは複数存在するが7、本稿では、Apple「移動傾向レポート」を用いた8。移動傾 向レポートは、人々の徒歩(walking)、自動車(driving)、公共交通機関 (transit)での移動量であり、2020 年 1 月
13 日を基準(=100)とした相対値が、 国や地域、都市別に日々ほぼラグなく公表されている9。また、足許では、日本銀 行が 2020 年 10 月の「地域経済報告」において、人手の動きを表す高頻度データ として当該計数を紹介する等、注目度も高い。なお、同報告でも指摘の通り、オ ルタナティブデータの利用にあたってはサンプルの偏り等に留意する必要がある。 本稿では、公表された計数をそのまま用いず、主成分分析により、「日本全体で の人手の動きを表すファクター」の抽出を行った10。具体的には、2020 年 3 月か ら同年 10 月 16 日を分析対象期間とし、47 都道府県の徒歩・公共交通機関、全 7 人手の動きを表すオルタナティブデータとしては、NTT ドコモ「モバイル空間統 計」や KDDI「KDDI Location Data」、Agoop「流動人口データ」等が挙げられる。 8 Apple は移動傾向レポートについて、「Apple マップで経路が検索された回数を 数え、収集されているデータと比較することによって、人々の徒歩、自動車、公 共交通機関での移動量の変化として世界各地のデータに反映される」と説明して いる。 9 なお、同報告では、「当該データは太平洋標準時で定義されているため、1 日ず らして算出した」としており、本稿もこれに倣った。 10 主成分分析によるファクター抽出は、経済分析において一般的な手法であり、 例えば、足許、Fuleky[2020]は、COVID-19 による景気後退からの回復を予測する ため、主成分分析を用いた週次の経済活動指数を開発している。
94 変数11に対して主成分分析を行い、その第一主成分ファクターを用いた。【図 2】【図 3】は、主成分分析の結果である。第一主成分の寄与率は 80%と高く【図 2】、その固有ベクトルは同符号であり【図3】12、当該主成分を「日本全体での 人手の動きを表すファクター」と考えることができる。 【図4】は、標準化した第一主成分スコア(以下、人手の動き指数)とサー ビス消費の推移である。両者は相関関係にあり、当該指数を用いることにより、 「量」ベースでの議論が可能であることが確認される。但し、前述の通り、両者
にはそれぞれカレンダー要因とみられる振幅がみられ、このままでは日単位での 比較をすることはできない。以下では、それぞれのカレンダー要因(曜日・祝日) 調整値を作成する。 11 自動車については、一部欠損値があるため対象外とした。 12 得られた固有ベクトルに-1 を乗じている。
3.カレンダー要因調整値の作成 3-1.データの可視化 まず、両計数のカレンダー要因の特徴を可視化により観察する。【図5】 【図6】は、それぞれ、曜日別のサービス消費、人手の動き指数であり、大きな 特徴として、ともに土曜日、日曜日に増加する傾向が確認される。
同様に、【図7】【図8】は、祝日13におけるサービス消費、人手の動き指数 である。分析対象期間中の祝日数が少ないことには注意が必要であるが、両計数 ともに祝日の分布は二峰性となっていることが確認される。これは、通常、祝日 は、サービス消費や人手の動きが増加する傾向にあるものの、本年 4 月や 5 月に おいては、外出自粛等による影響が強く出たことに起因するものと考えられる。 3-2.カレンダー要因調整モデル
以上を踏まえ、カレンダー要因(曜日・祝日)調整モデルとして、原系列𝑦𝑡 を、トレンド成分𝜇𝑡 、曜日成分𝑤𝑒𝑒𝑘𝑡 、祝日成分𝛽 ℎ𝑜𝑙𝑖𝑑𝑎𝑦𝑡 (祝日=1、それ以外 =0)の和とした(1)~(3)の状態空間モデルを仮定する1415。 13 祝日は、内閣府「「国民の祝日」について」を用いた。 14 季節調整や状態空間モデルについては、大島[2019]、松浦[2017]、北川[2005]、 樋口[2011]、高岡[2015]を参考にした。 15 本稿ではシンプルなモデルを想定したが、外れ値処理等も含め改良の余地があ ると考えられる。
𝑦𝑡 ∼ 𝑁(𝜇𝑡 + 𝑤𝑒𝑒𝑘𝑡 + 𝛽 ℎ𝑜𝑙𝑖𝑑𝑎𝑦𝑡 , 𝜎𝑦
2) − (1) 𝜇𝑡 ∼ 𝑁(2 𝜇𝑡−1 − 𝜇𝑡−2 , 𝜎𝜇 2) (𝑡 > 2) − (2) 𝑤𝑒𝑒𝑘𝑡 ∼ 𝑁(∑ 6 𝑙=1 − 𝑤𝑒𝑒𝑘𝑡−𝑙 , 𝜎𝑤𝑒𝑒𝑘 2 ) (𝑡 > 6) − (3) 推計結果は、【図9】【図10】(青線は原系列、赤線は中央値、シャドー は 95%信頼区間)であり、両計数とも当該モデルで全体の動きを概ね説明できて いること【図9ー1】【図10-1】、曜日や祝日成分への分解が、前節の想定 通り行われていること【図9-2~4】【図10-2~4】が確認される。 <カレンダー要因調整済みサービス消費>
<カレンダー要因調整済み人手の動き指数>
サービス消費、人手の動き指数のトレンド成分をカレンダー要因調整値とし て両者を比較すると、原系列同様、相関関係にあることが確認される【図11】。 これで日単位での比較が可能となった。
4.日次サービス消費指数の作成 最後に、カレンダー要因調整済みサービス消費を被説明変数、同・人手の動 き指数を説明変数として単回帰分析を行い、その推計値16を日次サービス消費指数 とする【図12】(青線はカレンダー要因調整済みサービス消費、赤線は日次サ ービス消費指数)。日次サービス消費指数の予測値をみると、特に、9 月 19 日~ 9 月
22 日の 4 連休にかけては、3 月のピークを上回って大きく増加している。実 際、2020 年 9 月 24 日付日本経済新聞は、「全日空の連休中の 1 日平均利用者数 は 7 万 2 千人と今年 5 月のゴールデンウイーク(6 千人)、8 月のお盆休み(4 万 8 千人)から大幅に増えた」と報じており、こうした報道とも整合的である。 5.まとめ 本稿では、人手の動きを表すオルタナティブデータを用いて、日次サービス 消費指数を作成した。当該指数は、日々ほぼラグなく作成可能なため、COVID-19 の状況に経済活動が大きく左右される足許のような局面では、有用な分析手法と 考えられる。今後は、人手の動き指数の特性、新たなカレンダー要因モデルの検 討、サービス消費との頑健性等をモニタリングしつつ、改良を加えていきたい。 16 推計期間は 2020 年 3 月から同年 8 月、同年 9 月以降は予測値。
(注)本レポートの内容により、直接的・間接的を問わず、何らかの被害をこう むった場合にも一切の責任を負いません。また、予告なしに変更または廃止する ことがあります。 (出所)総務省「家計調査」、Apple「移動傾向レポート」をもとに作成