Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Pythonで構築する全国市町村ナレッジグラフ: GraphRAGを用いた意味的地域検索への応用

Avatar for negi111111 negi111111
November 08, 2025

Pythonで構築する全国市町村ナレッジグラフ: GraphRAGを用いた意味的地域検索への応用

PyCon mini 東海 2025で登壇した内容に関する資料です。
URL:https://tokai.pycon.jp/2025/
内容:
全国1741市町村の統計データであるSSDSE(教育用標準データセット)と住民基本台帳人口移動データを用いた市町村間の人の流れを示す人口移動データを組み合わせることで地域の動的な関係性が見えてきます。

本発表では、pandasとnetworkxを用いて都市間の人の流れを表現する「人口移動ナレッジグラフ(知識グラフ)」を題材として、構築するまでに必要となる技術要素について解説を行います。

さらに、構造化されたグラフとテキスト情報を活用しGraphRAGを用いて、自然言語で対話できる意味的な地域検索アプリのデモも行います。静的なテーブルデータの集合を、Pythonを用いて人やモノの「関係性」という動的な側面を捉えた知識グラフに変換し、生成AIと組み合わせることで新たな価値を引き出すまでの一連の流れを紹介します。

グラフデータに関する事前知識は一切不要なのでこの機会に一緒に入門してみませんか?

Avatar for negi111111

negi111111

November 08, 2025
Tweet

More Decks by negi111111

Other Decks in Technology

Transcript

  1. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. Pythonで構築する人口移動ナレッジグラフ: GraphRAGを用いた意味的地域検索への応用

    丹野 良介 NTTドコモビジネス株式会社 イノベーションセンター 2025/11/08(土) 中日ホール&カンファレンス@名古屋 全国市町村 資料はここから
  2. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 3 本日のゴール

    / 対象者 「自分にぴったりの街はどこ?」を市町村・人口データを用いて導き出す! →手段として、知識グラフやGraphRAGなどを取り上げます 【どんな方に聞いてもらいたいか】 • pandasでの基本的なデータ処理経験はあるが、ネットワーク分析やグラフの応用に興味がある方 • RAGの概念は知っているが、その入力としてテーブルデータだけでなく、グラフ構造を活用する方法に興 味がある方 • チュートリアルは一通りなめられるけど、どうやって他のデータに応用したらよいか迷っている方 • 一歩進んだ公的統計データのような、身近で複雑な実データを活用した実装例を知りたい方 【オーディエンスに求める前提知識】 • Pythonの基本的な文法と、pandas の基本的な操作に関する知識 • グラフ理論、知識グラフ、GraphRAG、グラフニューラルネットワーク等のグラフデータに関する事前知 識は一切不要です
  3. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 4 本日のゴール

    / 対象者 「自分にぴったりの街はどこ?」を市町村・人口データを用いて導き出す! →手段として、知識グラフやGraphRAGなどを取り上げます 【どんな方に聞いてもらいたいか】 • pandasでの基本的なデータ処理経験はあるが、ネットワーク分析やグラフの応用に興味がある方 • RAGの概念は知っているが、その入力としてテーブルデータだけでなく、グラフ構造を活用する方法に興 味がある方 • チュートリアルは一通りなめられるけど、どうやって他のデータに応用したらよいか迷っている方 • 一歩進んだ公的統計データのような、身近で複雑な実データを活用した実装例を知りたい方 【オーディエンスに求める前提知識】 • Pythonの基本的な文法と、pandas の基本的な操作に関する知識 • グラフ理論、知識グラフ、GraphRAG、グラフニューラルネットワーク等のグラフデータに関する事前知 識は一切不要です • つまりは・・・最後の発表枠ということでゆるく聞いて下さい!笑
  4. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 5 これから構築する全体アーキテクチャ

    • 検索クエリを投げて出力を得るためにはまずは データが必要! ユーザ層 名古屋と教育・医療・ 福祉のレベルで似た市 町村は?
  5. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 6 これから構築する全体アーキテクチャ

    • 知識グラフを構築する際のノード情報や繋がりを示すデータを 収集するところから ユーザ層 名古屋と教育・医療・ 福祉のレベルで似た市 町村は? ・全国の全市区町村統計データ ・wikipedia
  6. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 7 これから構築する全体アーキテクチャ

    • SSDSEの教育用データセットを用いる。 ユーザ層 名古屋と教育・医療・ 福祉のレベルで似た市 町村は? ・全国の全市区町村統計データ ・wikipedia {"地域コード": "R24203", "都道府県": "三重県", "市区町村": "伊勢市", "2020_総人口": 122765, "2020_総人口(男)": 58161, "2020_総人口(女)": 64604, "2020_日本人人口": 120782, "2020_日本人人口(男)": 57182, "2020_日本人人口(女)": 63600, "2020_15歳未満人口": 14205, "2023_幼稚園数": 8, "2023_幼稚園在園者数": 406, "2023_小学校数": 22,…
  7. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 8 これから構築する全体アーキテクチャ

    • これだと統計データのみなのでもう少し各ノード情報をリッチに したい ユーザ層 名古屋と教育・医療・ 福祉のレベルで似た市 町村は? ・全国の全市区町村統計データ ・wikipedia {"地域コード": "R24203", "都道府県": "三重県", "市区町村": "伊勢市", "2020_総人口": 122765, "2020_総人口(男)": 58161, "2020_総人口(女)": 64604, "2020_日本人人口": 120782, "2020_日本人人口(男)": 57182, "2020_日本人人口(女)": 63600, "2020_15歳未満人口": 14205, "2023_幼稚園数": 8, "2023_幼稚園在園者数": 406, "2023_小学校数": 22,… ※本来は全市区町村に関する巨大な知識グラフ 愛知 静岡 三重
  8. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 9 これから構築する全体アーキテクチャ

    • wikipediaの都市概要を示すサマリを追加 ユーザ層 名古屋と教育・医療・ 福祉のレベルで似た市 町村は? ・全国の全市区町村統計データ ・wikipedia {"地域コード": "R24203", "都道府県": "三重県", "市区町村": "伊勢市", "2020_総人口": 122765, "2020_総人口(男)": 58161, "2020_総人口(女)": 64604, "2020_日本人人口": 120782, "2020_日本人人口(男)": 57182, "2020_日本人人口(女)": 63600, "2020_15歳未満人口": 14205, "2023_幼稚園数": 8, "2023_幼稚園在園者数": 406, "2023_小学校数": 22,… ※本来は全市区町村に関する巨大な知識グラフ 愛知 静岡 三重 {"summary_text": "伊勢市(いせし)は、三重県南東部(南勢・伊勢志摩地 域)にある市。日本でも有数の観光地の一つで伊勢志摩地域の拠点都市であ る。”}
  9. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 10 これから構築する全体アーキテクチャ

    • グラフ構造のままLLMで検索するには? →GraphRAGを用いて、ユーザのクエリからグラフ情報を 検索できるようにする! ユーザ層 ※本来は全市区町村に関する巨大な知識グラフ ・全国の全市区町村統計データ ・wikipedia {"地域コード": "R24203", "都道府県": "三重県", "市区町村": "伊勢市", "2020_総人口": 122765, "2020_総人口(男)": 58161, "2020_総人口(女)": 64604, "2020_日本人人口": 120782, "2020_日本人人口(男)": 57182, "2020_日本人人口(女)": 63600, "2020_15歳未満人口": 14205, "2023_幼稚園数": 8, "2023_幼稚園在園者数": 406, "2023_小学校数": 22,… 名古屋と教育・医療・ 福祉のレベルで似た市 町村は? 愛知 静岡 三重 {"summary_text": "伊勢市(いせし)は、三重県南東部(南勢・伊勢志摩地 域)にある市。日本でも有数の観光地の一つで伊勢志摩地域の拠点都市であ る。”}
  10. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 11 これから構築する全体アーキテクチャ

    • グラフ構造のままLLMで検索するには? →GraphRAGを用いて、ユーザのクエリからグラフ情報を 検索できるようにする! ユーザ層 ※本来は全市区町村に関する巨大な知識グラフ ・全国の全市区町村統計データ ・wikipedia {"地域コード": "R24203", "都道府県": "三重県", "市区町村": "伊勢市", "2020_総人口": 122765, "2020_総人口(男)": 58161, "2020_総人口(女)": 64604, "2020_日本人人口": 120782, "2020_日本人人口(男)": 57182, "2020_日本人人口(女)": 63600, "2020_15歳未満人口": 14205, "2023_幼稚園数": 8, "2023_幼稚園在園者数": 406, "2023_小学校数": 22,… 名古屋と教育・医療・ 福祉のレベルで似た市 町村は? 愛知 静岡 三重 {"summary_text": "伊勢市(いせし)は、三重県南東部(南勢・伊勢志摩地 域)にある市。日本でも有数の観光地の一つで伊勢志摩地域の拠点都市であ る。”} ステップ1:データ整形 ステップ3:GraphRAG化 ステップ2:データ補強
  11. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 12 これから構築する全体アーキテクチャ

    • グラフ構造のままLLMで検索するには? →GraphRAGを用いて、ユーザのクエリからグラフ情報を 検索できるようにする! ユーザ層 ※本来は全市区町村に関する巨大な知識グラフ ・全国の全市区町村統計データ ・wikipedia {"地域コード": "R24203", "都道府県": "三重県", "市区町村": "伊勢市", "2020_総人口": 122765, "2020_総人口(男)": 58161, "2020_総人口(女)": 64604, "2020_日本人人口": 120782, "2020_日本人人口(男)": 57182, "2020_日本人人口(女)": 63600, "2020_15歳未満人口": 14205, "2023_幼稚園数": 8, "2023_幼稚園在園者数": 406, "2023_小学校数": 22,… 名古屋と教育・医療・ 福祉のレベルで似た市 町村は? 愛知 静岡 三重 {"summary_text": "伊勢市(いせし)は、三重県南東部(南勢・伊勢志摩地 域)にある市。日本でも有数の観光地の一つで伊勢志摩地域の拠点都市であ る。”} まずはここから
  12. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 13 利用するデータセットについて

    • SSDSE(教育用標準データセット:Standardized Statistical Data Set for Education) • データ分析のための汎用素材として、独立行政法人統計センターが作成・公開している統計データ • 主要な公的統計を地域別に一覧できる表形式のデータセット 名称 内容 SSDSE-市区町村 (SSDSE-A) 1741市区町村×多分野125項目 全国の全市区町村の、人口、経済、教育、労働、医療、福祉など、様々な分野の 統計データを収録しています SSDSE-県別推移 (SSDSE-B) 47都道府県×12年次×多分野109項目 人口、経済、教育、労働、医療、福祉など、様々な分野の統計データを、12年分 の時系列で収録しています SSDSE-家計消費 (SSDSE-C) 全国・47都道府県庁所在市×家計消費226項目 1世帯当たりの食料の年間支出金額(消費額)を、魚介、肉、野菜、果物、菓子、 飲料などに分類し、それぞれ詳細な品目別にデータを収録しています SSDSE-社会生活 (SSDSE-D) 全国・47都道府県×男女別×社会生活121項目 男女別に、スポーツ、趣味・娯楽、ボランティアなどの詳細な活動データや、1 日の睡眠、食事、学業、家事、仕事、趣味・娯楽などの時間配分データを収録し ています SSDSE-基本素材 (SSDSE-E) 全国・47都道府県×多分野93項目 人口、経済、教育、文化、医療、福祉など、様々な分野の統計データを収録し、 初学者にも扱いやすいデータセットです SSDSE-気候値 (SSDSE-F) 47都道府県庁所在市×月・年×気象42項目 気温、気圧、風速、日照、降水、降雪など、様々な気象データについて、月・年 別の平年値を収録しています 参考:SSDSE(教育用標準データセット) | 独立行政法人 統計センター 丁寧な解説書もある!
  13. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 14 中身をざっと確認してみる…Pandas使う?

    ❖ 表形式のデータ構造(=構造化データ)に関して効率的にデータ操作を行うことができる ➢csvとかExcelとかで扱える様なデータならまずは初手 df: pd.DataFrame = pd.read_csv(“hoge.csv”) ➢DataFrame オブジェクトを介して高速で効率的なデータ操作 内部でMatplotlib の機能を使用して散布図、棒グラ フ、箱ひげ図,...などを .plot() だけで実現 特定の行や列を選択またはフィルタリングなども抽 出は直感的に記述可能 age_sex = titanic[["Age", "Sex"]] 出典:https://pandas.pydata.org/docs/getting_started/index.html#getting-started
  14. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 15 中身をざっと確認してみる…いいや生成AIだね

    1741市区町村×多分野125項目のデータが格納されている(人口、経済、教育、労働、医療、福祉など…) どんなデータなのか確認したいだけならスプレッドシートが一番便利!(Geminiが便利すぎる) 核家族世帯数が非常に多い地域 (名古屋市など)では、婚姻件 数も突出して多く、他の地域と は異なる傾向 めっちゃ外れ値!
  15. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 16 テーブルデータから知識グラフの構造へ

    テーブルデータから各ノードとリンクの関係性をパースし、 networkXで扱える構造に変換
  16. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 17 これから構築する全体アーキテクチャ

    • グラフ構造のままLLMで検索するには? →GraphRAGを用いて、ユーザのクエリからグラフ情報を 検索できるようにする! ユーザ層 ※本来は全市区町村に関する巨大な知識グラフ ・全国の全市区町村統計データ ・wikipedia {"地域コード": "R24203", "都道府県": "三重県", "市区町村": "伊勢市", "2020_総人口": 122765, "2020_総人口(男)": 58161, "2020_総人口(女)": 64604, "2020_日本人人口": 120782, "2020_日本人人口(男)": 57182, "2020_日本人人口(女)": 63600, "2020_15歳未満人口": 14205, "2023_幼稚園数": 8, "2023_幼稚園在園者数": 406, "2023_小学校数": 22,… 名古屋と教育・医療・ 福祉のレベルで似た市 町村は? 愛知 静岡 三重 {"summary_text": "伊勢市(いせし)は、三重県南東部(南勢・伊勢志摩地 域)にある市。日本でも有数の観光地の一つで伊勢志摩地域の拠点都市であ る。”} つぎはここから
  17. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 18 ノード情報のリッチ化

    • 構築したグラフの『ノード(市区町村)』に、意味的な情報を追加 • SSDSEデータは『総人口』や『65歳以上人口』といった定量的なデータ • それだけでは『その都市がどんな場所か』はわからない • Wikipedia API を使い、各市区町村の概要テキスト (例:『名古屋市は愛知県の県庁所在地で...』)を 取得し、ノードの属性情報として補完する • ※重複する都市名が結構あるので注意 例: 府中市 (2件) • 東京都 府中市(人口 262,790人) • 広島県 府中市(人口 37,655人) 朝日町 (3件) • 山形県 朝日町(人口 6,366人) • 富山県 朝日町(人口 11,081人) • 三重県 朝日町(人口 11,021人) ・・・ 名古屋市 - Wikipedia import wikipedia page = wikipedia.page(“名古屋市”) page.summary
  18. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 19 これから構築する全体アーキテクチャ

    • グラフ構造のままLLMで検索するには? →GraphRAGを用いて、ユーザのクエリからグラフ情報を 検索できるようにする! ユーザ層 ※本来は全市区町村に関する巨大な知識グラフ ・全国の全市区町村統計データ ・wikipedia {"地域コード": "R24203", "都道府県": "三重県", "市区町村": "伊勢市", "2020_総人口": 122765, "2020_総人口(男)": 58161, "2020_総人口(女)": 64604, "2020_日本人人口": 120782, "2020_日本人人口(男)": 57182, "2020_日本人人口(女)": 63600, "2020_15歳未満人口": 14205, "2023_幼稚園数": 8, "2023_幼稚園在園者数": 406, "2023_小学校数": 22,… 名古屋と教育・医療・ 福祉のレベルで似た市 町村は? 愛知 静岡 三重 {"summary_text": "伊勢市(いせし)は、三重県南東部(南勢・伊勢志摩地 域)にある市。日本でも有数の観光地の一つで伊勢志摩地域の拠点都市であ る。”} つぎはここから
  19. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 20 グラフとは

    グラフとはいくつかの点とそれらを結ぶ線からできている図のこと。ここではネットワークと呼ぶ。 ネットワークの定義 • ノード(点): e.g. 技術スキル、知識、人脈、 ・・・ • エッジ(線): e.g. プロジェクト、会話のつながり、・・・ • 次数 :ノードから出るエッジの数 参考:林先生(NTT コミュニケーション科学基礎研究所)「知識グラフの埋め込みとその応用」 愛知県周辺の 主要自治体
  20. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 21 知識グラフとは(KG)

    • 知識を構造化された事実構造で表現した有向グラフのこと。 • 知識グラフ(Knowledge Graph)、教育分野だとコンセプトマップといったりする。 • ここでは頭文字をとって KG と表記する場合があります • 事実はグラフノードと,その間の関係からなるトリプル構造(h, r, t)で表現される • h : read,r : relation,t : tail • 例: (Python, 関連する, プログラミング言語)、(Python, 持つ, オブジェクト指向) 図引用:¿Qué es el Knowledge Graph de Google? - Komunicando
  21. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 22 例:本発表における知識グラフ

    今回の発表をグラフとして表現してみると? • PyCon は held_at (開催される) という関係性で 名古屋 という場所に接続 • PyCon は features_talk (トークがある) という 関係で GraphRAG に接続 • GraphRAG は uses (利用する) という関係で Knowledge Graph に接続 • Knowledge Graph は uses で NetworkX に接続 一見バラバラに見える概念が、関係性を辿ることで 一つの知識のネットワークとして繋がる。 これが知識グラフの基本的な考え方!
  22. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 23 例:本発表における知識グラフ

    今回の発表をグラフとして表現してみると? • PyCon は held_at (開催される) という関係性で 名古屋 という場所に接続 • PyCon は features_talk (トークがある) という 関係で GraphRAG に接続 • GraphRAG は uses (利用する) という関係で Knowledge Graph に接続 • Knowledge Graph は uses で NetworkX に接続 一見バラバラに見える概念が、関係性を辿ることで 一つの知識のネットワークとして繋がる。 これが知識グラフの基本的な考え方!
  23. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 24 知識グラフの例

    図引用:海外メディアが警鐘:NVIDIAの「循環取引」問題を会計士が解説| 藤後 友弘@海外起業会計士 Nvidia, Microsoft, and OpenAI: This Chart Captures AI’s ‘Circular Financing.’ - Barron's 身近にあふれる魅力的な知識グラフ!
  24. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 25 •

    検索拡張生成(Retrieval-Augmented Generation:RAG) • 入力クエリに関連する補助情報を与えることで、 事前学習済みのLLMの性能を向上させることが可能 • LLMはあくまで学習されたデータに基づいて回答を作る • →学習外の情報には回答できない≒ハルシネーションがある • →補助情報として用いることで性能向上ができる(生成AI標準技術) c ❖ Step1: ベクトルストア構築 ➢ 補助知識に含まれる各文章に対して埋め込み表現 を生成し、ベクトルストアに格納 ➢ 補助知識には以下の2つのデータセットを用意 ➢ 1741市区町村×多分野125項目(SSDSE) ➢ 各市町村の概要(Wikipedia) c ❖ Step2: 関連文章の検索 ➢ クエリに関連する文章群をベクトルストアから検索 ➢ 類似する関連文章の候補を作成 c ❖ Step3: クエリの更新とモデルの応答 ➢ 関連文章の候補を元のクエリと結合 ➢ 結合したクエリをLLMの入力とする • 特定のドメインに特化した情報を要求するクエリや最 新の情報を必要とする場合に、より正確な出力を提供 そもそもRAGとは Step2:関連
  25. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 26 GraphRAGとは

    • RAGでは知識を独立したテキストの断片(チャンク)としてしか扱えない • つまり、構造関係に基づいた回答が生成できない (以下の例は一般的なことなので、答えられるはずですが…) • GraphRAGを用いることで、関係性を保持しながら構造を 考慮した理解した回答を返せるようにする GraphRAG: Practical Guide to Supercharge RAG with Knowledge Graphs DBに『名古屋市の概要』 『豊田市の概要』『名古 屋から豊田への移動デー タ』がバラバラに保存 名古屋と経済的に 最も繋がりの強い 都市は? 『名古屋』『経済』 『繋がり』という単 語を含むテキスト片 を探すだけ R A G テキスト検索に加えて、 グラフの構造を検索 名古屋と経済的に 最も繋がりの強い 都市は? 構造と文脈に基づい た回答の生成 グ ラ フ R A G →データが本来持っている『都市と都市の関係性』や 『データの構造』が、検索の際に失われてしまう RAG GraphRAG
  26. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 27 GraphRAG用のデータに変換

    • 定義されているスキーマに先程のJSONファイルをパース • あとは graphrag index コマンドに csv ファイルを渡せばインデックスDBを作ってくれる • 詳細はマイクロソフトの公式チュートリアルなどを参照:Inputs – GraphRAG • ※公式チュートリアルでもそこそこお金がかかるので注意
  27. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 28 これから構築する全体アーキテクチャ(再掲)

    • これで準備完了! ユーザ層 ※本来は全市区町村に関する巨大な知識グラフ ・全国の全市区町村統計データ ・wikipedia {"地域コード": "R24203", "都道府県": "三重県", "市区町村": "伊勢市", "2020_総人口": 122765, "2020_総人口(男)": 58161, "2020_総人口(女)": 64604, "2020_日本人人口": 120782, "2020_日本人人口(男)": 57182, "2020_日本人人口(女)": 63600, "2020_15歳未満人口": 14205, "2023_幼稚園数": 8, "2023_幼稚園在園者数": 406, "2023_小学校数": 22,… 名古屋と教育・医療・ 福祉のレベルで似た市 町村は? 愛知 静岡 三重 {"summary_text": "伊勢市(いせし)は、三重県南東部(南勢・伊勢志摩地 域)にある市。日本でも有数の観光地の一つで伊勢志摩地域の拠点都市であ る。”}
  28. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 30 出力例(本来は結構長いけど、省略)

    graphrag query --root . --method global --query “現在、福岡市に住んでいて福岡市の良いところを維持 しながら2拠点生活をしたと考えている。また、飛行機を利用したいと思っているため、九州以外での2拠 点都市を考えている。特徴としては、温泉地として有名で、自然が豊かで静かに暮らせそうな街はどこです か? “ 1) Nozawa Onsen Village(長野県、野沢温泉) - 要点: 九州外の拠点として最も分かりやすい温泉地のひとつ。温泉資源が豊かで自然環境に恵まれ、静かな 暮らしが期待できます。 2) Hakone region(神奈川県) - 要点: 箱根は温泉資源が非常に充実しており、芦ノ湖・自然景観・観光資源が揃っている一方、静かな暮ら しを実現しやすい地域として評価されます。九州以外の二拠点生活の候補として高い適性が示されています。 3) Nikko Yumoto Onsen area(栃木県、日光湯元温泉) - 要点: 温泉地としての資質が強く、自然環境と文化資産が豊か。Meiji eraの交通拡張で旅行アクセスが広 がり、福岡市を拠点とした二拠点生活の一拠点として現実的な選択肢とされます。特に航空・陸路のアク セスが示唆されており、海外との交流も想定され得ます。
  29. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 31 出力例(本来は結構長いけど、省略)

    補足・重要なポイント - 二拠点生活の“第二拠点”候補として、これらの地域は「温泉資源が確実に存在」し「自然が豊かで静かな 暮らし」が見込まれる点が共通します。 - データ上は、多くの候補で温泉資源と自然資源の組み合わせが明示されています。 - Nikko Yumoto Onsen のように航空/鉄道のアクセスが明確に示唆されているケースもあり、福岡市から の飛行機移動を前提とする二拠点設計には特に有利なケースがあります。 - 該当するデータは「air travel links(航空機移動)」を含意する記述が含まれます。 [Data: Reports (1603, 1604, 2580, 2581, 5827, +more)] - 九州内の候補(例:Yufuin Onsen, Nozawa Onsen 以外にも複数の九州外候補が挙げられていますが、 質問の条件は「九州以外」での拠点限定です。九州内候補は本回答の範囲外としました。 データ出典のまとめ - Nozawa Onsen Village(長野) [Data: Reports (319)] - Hakone region(神奈川) [Data: Reports (1211, 3112, 3113, 4961, 4963, +more)] - Nikko Yumoto Onsen(栃木) [Data: Reports (1603, 1604, 2580, 2581, 5827, +more)] - Minakami Onsenkyo(群馬) [Data: Reports (1802, 1805, 1806, 1807, 1192)] - 他にもたくさん・・・・・
  30. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 32 もしコードを動かす場合の注意点

    • GitHubにはGraphRAG用のインデックスDBも含まれています • SSDSEの市町村データは全都市のものを利用して作っているのでめちゃめちゃ巨大です • 構築に9時間ぐらいかかった気がします • GraphRAGを使って問い合わせしてレスが返ってくるまで時間がかかります • 巨大なグラフ構造を探索するので・・・ • 特に、最適化に関する改善は施していません • また、DBを作る際にLLMに問い合わせしているので、お金が結構かかっています(数千円) • マイクロソフトの公式チュートリアルもお金がそこそこかかりますので注意 Getting Started - GraphRAG
  31. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 33 まとめ

    • 全国1741市町村の統計データであるSSDSE(教育用標準データセット)を用いて人口移動ナレッジグラ フ(知識グラフ)を構築する手順を説明しました • 構造化されたグラフとテキスト情報を活用しGraphRAGを用いて、自然言語で対話できる意味的な地域検 索をお試ししました • 静的なテーブルデータの集合を、Pythonを用いて人やモノの「関係性」という動的な側面を捉えた知識グ ラフに変換し、生成AIと組み合わせることで新たな価値を引き出すまでの一連の流れを紹介しました • グラフデータに関する超入門は終了です! ユーザ層 ・全国の全市区町村統計データ ・wikipedia 愛知 静岡 三重
  32. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 36 世間は狭いよ現象

    現実の社会的ネットワークでは、比較的少数の人を介して誰ともつながれることが知られている。 (※「スモールワールド」として知られている) • 社会心理学者スタンレー・ミルグラムが1967年に行ったスモールワールド実験で検証 • 「六次の隔たり」というフレーズが生まれた • 全ての人や物事は6ステップ以内で繋がっているという、仮説 • 友達の友達…を介して世界中の人々と間接的な知り合いになることができる 開始 ターゲット
  33. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 37 ネットワークのクラスター的現実

    「新しい仕事を見つける力になってくれたのは親しい友人ではなく、ちょっとした知り合いであること」 (社会学者マーク・グラノヴェッター(1969年)) • 「弱い社会的絆(弱い紐帯)の重要性」として報告され、社会学における重要な知見となる • 親しい友人はでは知りうる情報が似ていて新しい情報が得られない • 一方、単なる知り合いの方が異なる情報を持っているため、 新しい仕事を見つけるのには有用なことがある つながりは弱いほうがメリットが多い?!【トレンド図解】『弱い紐帯』 - 図解で読み解く方程式
  34. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 38 •

    確率に支配されるようなランダム・無秩序な事象 は正規分布に従う • 一方、そこから秩序が生まれると(秩序の創発、相 転移とも呼ばれる)、ベキ法則に従うようになる • 現実のネットワークは、全く無秩序な状態ではな く、秩序が創発した、ちょうど相転移を起こした ような状態でありベキ法則に従うことが多いとさ れる • ベキ則は以下の特徴をもつ • どこにもピークがなく、なめらかに減少する • 分布のすそ野は正規分布よりも広い • ごく少数のきわめて大きい事象と無数の小さい事象が 共存する状態を表す ベキ則に従う分布(スケールフリー・ネットワーク) 「ハブ」 が存在する
  35. © NTT DOCOMO BUSINESS, Inc. All Rights Reserved. 39 「ネットワークの成長」と「ハブの優先的選択」

    複雑ネットワークは、頂点どうしがスケールフリーのベキ法則に従う分布によって連結しているというモデ ルを初めて提唱する。(Barabási-Albertモデル, 1999年)複雑ネットワークは、 • ①新しい頂点を追加していくことによってネットワークが成長する(成長) • ②新しい頂点はもともと枝が多かった頂点に優先的に接続される(優先的選択) • e.g. インフルエンサーがSNSを開設すると即100万人達成! という2つの普遍的な特徴を持っている 『モデリング・シミュレーション入門』 井庭 崇 第10回 成長するネットワークのシミュレーション