Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Python フレンドリーなクラウドデータプラットフォーム Snowflake のお話 ~ デ...

Avatar for あれ あれ
April 28, 2025

Python フレンドリーなクラウドデータプラットフォーム Snowflake のお話 ~ データ分析基盤のアレもコレも Python でやってみよう

2025年4月27日 PyLadies Tokyo Meetup #100 Python入学式 でのLT資料です。

Avatar for あれ

あれ

April 28, 2025
Tweet

More Decks by あれ

Other Decks in Technology

Transcript

  1. 2025 DATUM STUDIO Co. Ltd. 2 自己紹介 【名前】 あれ /

    梶谷 美帆 / Miho Kajiya 広報さんにカッコよく撮影していただいた 【所属】 DATUM STUDIO株式会社 データエンジニアリング本部 データエンジニア部 GL/プリンシパルエンジニア 【ユーザーコミュニティ】 Snowflake ユーザーグループ(SnowVillage) 運営 企画チーム(Mayors) / 女子会幹事 / コンテナグ ループ リーダー primeNumber User Group(pUG) リーダー 2024- 2025 Data Superheroes Data Superhero のすがた X
  2. 2025 DATUM STUDIO Co. Ltd. コンテンツ • 自己紹介(さっきの) • Snowflake

    とは • Python と Snowflake • データ分析基盤 • Snowflake x Python でできるデータ分析基盤
  3. 2025 DATUM STUDIO Co. Ltd. 実は、Snowflake には Python のための機能が たくさんあるのです

    ↑公式キャラクターの Snowflake, The Polar Bear https://medium.com/snowflake/announcing-the-ga-release-of-snowflake-python-connector-with-nanoarrow-1d70fd8ba3b1
  4. © 2024 DATUM STUDIO Co. Ltd. 12 Python と Snowflake

    Python のための機能、いろいろあります • Snowflake Connector for Python • Snowpark for Python • Python UDFs / UDTFs • Snowpark Stored Procedures for Python • Streamlit in Snowflake • Snowflake Python Worksheet • Snowpark ML • Snowflake API for Python • Snowflake Extension for Visual Studio Code • Snowflake Notebook • Snowpark pandas API ち が い ま す よ ー っ こ れ だ か ら し ろ う と は ダ メ だ ! も っ と よ く 見 ろ ! 全 部 同 じ じ ゃ な い で す か ※公開にあたり代役を立てました
  5. © 2024 DATUM STUDIO Co. Ltd. 14 データ分析基盤 (主に企業や組織の)データを収集、保存、分析するためのシステムを「データ分 析基盤」と呼びます

    「実践的データ基盤への処方箋 ビジネス価値創出のためのデータ・システム・ヒトのノウハウ」より
  6. 2025 DATUM STUDIO Co. Ltd. データ分析基盤の技術スタック SaaSデータ 業務データ データウェアハウス ビジネス・インテリジェンス

    会計 データ 会計 データ 会計 データ 会計 データ 会計 データ 会計 データ データインジェスト Fivetran Airbyte トランスフォーメーション dbt Dataform Redshift Snowflake BigQuery Synapse Looker Redash DOMO Tableau Reverse ETL Census データガバナンス hightouch AI/ML Databricks SageMaker TROCCO AWS IAM Amazon CloudWatch Logs AWS CloudTrail CData やることが… やることが多い…!!
  7. 2025 DATUM STUDIO Co. Ltd. データ分析基盤のアーキテクチャ 経理システム 受発注システム 在庫システム ゲームのシステ

    ム 電子書籍のシス テム 物販のシステム YouTube GA4 Salesforce Kintone データサイエンティスト ビジネスアナリスト 経理部 営業部 倉庫 データサイエンティスト 営業 エンジニア プランナー data governance ※よくあるメガベンとかの データ基盤(ハイレベル図) アナリスト やることが… やることが多い…!!
  8. 2025 DATUM STUDIO Co. Ltd. Snowflake x Python でできるデータ分析基盤 ✓

    Snowflake に組み込まれた Notebook が利用可能 ✓ Python 用のワークシートもあ り、簡単な関数はこちらで作成 することもできる ✓ 困ったらコンテナサービスで JupyterLab を立てる手もあり 分析 ✓ Python Connector が初歩の 方式 ✓ Spark ライクで処理が Snowflake 側で処理される Snowpark for Python ✓ Pandas API で Pandas ユー ザーも安心 変換 ✓ Streamlit in Snowflake によ り Snowflake に Streamlit ア プリをホスト可能 可視化 https://www.snowflake.com/ja/blog/s nowflake-to-acquire-streamlit/ Notebook Streamlit Pandas API
  9. 2025 DATUM STUDIO Co. Ltd. Snowflake x Python でできるデータ分析基盤 ✓

    Snowflake 自身のワークフロー自動化機能 (Task)をPython API で作成可能。記法がとて も Airflow っぽい ✓ Airflow 自体、コンテナサービスで建てられます ✓ Notebook 単独でスケジュール実行も設定可能 ワークフローエンジン ✓ 2025年4月、PyPI からのパッケージインストー ルが可能になりました。以前は Anaconda の専用 チャンネル経由かアーカイブを持ち込む必要が あった ✓ コンテナサービスで Flask、Django などのアプ リを立てることも可能。というか、 その他もろもろ Airflow in Snowflake コンテナで 立てられれば 全部解決します
  10. 2025 DATUM STUDIO Co. Ltd. さいごに • Snowflake って、SQL が第一言語ではあるけど、Python

    でかなり操 作ができるし、とっても Python フレンドリーなんです! • 興味があればトライアル(400ドル分が無料、最大30日間利用可 能)ぜひ使ってみてください! • SnowVillage もよろしくお願いします! SnowVillage Snowflake Trial