Geoデータは、分析者にとって扱いにくい Geoデータは、分析者のワークフローの外にあることが多いです。 8 入力データ CSV, Parquet 分析環境 出力 GeoJSON, Shapefile Geoparquet, WKT, … Python GISツール Geo対応DB(PostGISなど) (専用環境) ↓ Python / SQL 分析・可視化・モデリング 分析・可視化・モデリング 通常の分析 Geo分析 フォーマットが特殊で多様 GeoデータはCSVやParquetのように統一され ておらず、読み込み時点で障壁になりやすい。 →まず開くところから大変 専用ツール・DBが必要になることが多い Geo分析ではGISやPostGISなどの専用ツール を経由する場面があり、分析の準備コストが高 くなる。 →普段の分析環境だけで完結しない 分析ワークフローから分離される Geo分析は通常の分析フローの外で処理される ことが多く、仮説検証のスピードを下げてしま う。 →いつもの分析の延長で扱えない Python単体ではスケーラブルに扱いにくい Geo処理はPythonでも可能だが、大規模デー タでは処理が遅くなりやすい。 →データが増えると急に重くなる