Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Snowflake Openflow さわってみた
Search
Yuki Ishikawa
October 01, 2025
Technology
0
460
Snowflake Openflow さわってみた
2025.10.01 Snowflake 中部ユーザ会 #5
https://techplay.jp/event/985802
Yuki Ishikawa
October 01, 2025
Tweet
Share
More Decks by Yuki Ishikawa
See All by Yuki Ishikawa
第3回 Snowflake 中部ユーザ会- dbt × Snowflake ハンズオン
hoto17296
4
1.2k
ORM と向き合う
hoto17296
14
11k
明日業務で役立たない Web 開発 TIPS
hoto17296
0
220
クソ bot 実装ライブコーディング
hoto17296
0
250
DeepGBM 論文の紹介
hoto17296
0
690
試行錯誤のための Docker 活用術
hoto17296
4
3.2k
Hive 集計テクニック
hoto17296
0
540
データ分析と Docker / Data Analysis with Docker
hoto17296
0
400
DeepCluster 論文の紹介
hoto17296
7
2.6k
Other Decks in Technology
See All in Technology
もう怖くないバックグラウンド処理 Background Tasks のすべて - Hakodate.swift #1
kantacky
0
110
opsmethod第1回_アラート調査の自動化にむけて
yamatook
0
280
Agentic Codingの実践とチームで導入するための工夫
lycorptech_jp
PRO
0
150
EKSで実践する オブザーバビリティの現在地
honmarkhunt
2
300
論文検索を日本語でできるアプリを作ってみた
sailen2
0
110
「静的解析」だけで終わらせない。 SonarQube の最新機能 × AIで エンジニアの開発生産性を本気で上げる方法
xibuka
2
270
意志を実装するアーキテクチャモダナイゼーション
nwiizo
3
1.7k
生成AI活用によるPRレビュー改善の歩み
lycorptech_jp
PRO
4
1.1k
Java ランタイムからカスタムランタイムに行き着くまで
ririru0325
0
110
APMの世界から見るOpenTelemetryのTraceの世界 / OpenTelemetry in the Java
soudai
PRO
0
140
AWS CDK の目玉新機能「Mixins」とは / cdk-mixins
gotok365
2
250
なぜAIは組織を速くしないのか 令和の腑分け
sugino
8
2.8k
Featured
See All Featured
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
310
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
930
How to Build an AI Search Optimization Roadmap - Criteria and Steps to Take #SEOIRL
aleyda
1
1.9k
Visualization
eitanlees
150
17k
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
0
210
My Coaching Mixtape
mlcsv
0
61
Java REST API Framework Comparison - PWX 2021
mraible
34
9.2k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
760
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.3k
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
110
Testing 201, or: Great Expectations
jmmastey
46
8.1k
AI: The stuff that nobody shows you
jnunemaker
PRO
3
320
Transcript
Snowflake Openflow さわってみた 2025.10.01 Snowflake 中部ユーザ会 #5 Yuki Ishikawa /
@hoto17296
注意事項 この資料のコンテンツは2025年8月に作られたものであり 2025年10月の時点でも既にちょっと情報が古いので お気をつけください
AGENDA 1. Openflow 概要 2. Openflow を試しに動かす (環境構築編) 3. Openflow
を試しに動かす (データ取り込み編) 4. 所感
Openflow 概要
Snowflake Openflow の概念 2025年6月に発表された新機能 あらゆる場所から Snowflake にデータを集約するための ETL ツール
Snowflake Openflow の実体 • Apache NiFi (ニーフィー) • データフローオーケストレーションツール •
SaaS とかのデータを「コネクタ」でとりにいったり、ワークフローを組んだり • 動作するインフラ • 現時点では AWS 上での Bring Your Own Cloud (BYOC) 版のみサポートされている • Kubernetes クラスタを自分で用意しないといけない • 公式ドキュメントの手順に従ってつくると Amazon EKS が作成される • 使用する VPC は「Openflow 用 (managed) を作る」か「既存の VPC に載せる」か選べる • 今後 Snowpark Container Services (SPCS) 版も出る予定らしい? Snowflake Openflow の実体は Kubernetes 上で動く Apache NiFi
イメージ図 Snowflake とは別のところに Kubernetes クラスタがいて、そこで ETL 処理が実行される Kubernetes クラスタ (=
Deloyment) Snowflake Runtime 他の Runtime Manager Connector • 外部リソースへの接続情報 • その他、各種設定 外部リソース User / Role Openflow 利用ユーザ • Type = PERSON • Openflow に関する権限をつける Openflow Runtime 用ユーザ • Type = SERVICE • 実行したいタスクに必要な権限をつける Database / Schema / Table • データの取り込み先 API
Openflow を試しに動かす (環境構築編)
開始! まずは Openflow 管理用のページにアクセスする Snowsight 上に管理画面があるわけではなく Openflow 管理用の別サイトに飛ばされる (なんで?)
Deployment 作成 K8s クラスタを動かす場所を選ぶ (いまはまだ AWS しか選べない) VPC どうするか選ぶ Managed
のほうが簡単 Openflow 管理者に割り当てる Role を指定する (作っておく) PrivateLink もできる
EKS クラスタ作成 (1/2) AWS Cloud Formation の スタックテンプレートが生成される スタックテンプレートを使用して リソースを作成する
(まだ EKS 作られない) スタックテンプレートの パラメータはほとんど いじらなかった
EKS クラスタ作成 (2/2) EC2 インスタンス内で OpenTofu (≒ Terraform) が 動いて
EKS クラスタが作られる 1時間くらいかかる…
Deployment が正常かどうか確認 (おそらく) EKS クラスタ内の Manager ノードが 「この Deployment は起動しているぞ」と
ping を送ってきている (それが確認できると Active になる)
Runtime を作成する Deployment さえできてしまえば Runtime の作成は超簡単
Runtime の Canvas 画面を開く (たぶん) Runtime 側が OAuth クライアントになっていて Snowflake
アカウントを使用して OAuth 認証している この Canvas 画面が開けたなら 環境構築は完了ってことで良さそう
Openflow を試しに動かす (データ取り込み編)
今回やりたいこと Google Sheets の内容を Snowflake のテーブルに取り込む 本当は「Drive 全部を Cortex Search
に取り込んで RAG チャットボット」 をやりたかったけど挫折した
使用するコネクタの公式ドキュメント https://docs.snowflake.com/en/user-guide/data-integration/openflow/connectors/google-sheets/setup
Google Cloud でプロジェクトとサービスアカウントを作成する
サービスアカウントのキー (JSON) を生成する このキーを使用することで Openflow の Runtime は サービスアカウントの権限で Google
Cloud にアクセスできる
サービスアカウントにファイルの閲覧権限を付与
Google Sheets コネクタを Runtime に追加 この中から「Google Sheets」コネクタを 選択して Runtime に追加する
※ スクショ撮り忘れた
コネクタがキャンバスに追加された
コネクタの各種パラメータを設定する 設定項目いろいろある • Google Cloud にアクセスするサービスアカウントの認証情報 • 取り込む対象ファイルの ID •
Snowflake にアクセスするユーザの認証情報 • 取り込み先のデータベース情報
いざ起動 まずは全ての コントローラサービスを 有効化する コネクタを起動
うわあああああああああああ 右上の赤いところにマウスオーバーすると エラー詳細が出る これは 「Google Sheets API が使えない」 というエラーっぽい
プロジェクトで Google Sheets API を使用できるようにする この手順、公式ドキュメントに書いてなかった ※ 2025年8月時点
もろもろ割愛 このあと2時間くらい さまざまなエラーと格闘
なんか動いているっぽい!
きたああああああああ
所感
所感 • 競合製品 (Trocco とか) との比較はできない、もうしわけない… • 「試しに動かしてみる」までのハードルまぁまぁ高い • SPCS
版はやく出てほしい、マジで • 外部サービス連携するツールなのだからコネクタ設定周りが複雑なのはもう仕方ない、頑張るしかない • 一度仕組みを作ってしまえばあとは簡単で便利なのかもしれない 今回「データを取り込む」だけならプログラムは一切書かずに済んだ • EKS クラスタを数日放置しただけでまぁまぁかかった… ($) • 動かしっぱなしだと月10万円以上かかりそう • EKS は「リソースを止めておく」のも手間なので、趣味で遊ぶにはちょっときびしい • SPCS 版はやく出てほしい、マジで (料金体系どうなるかしらんけど) 便利っぽいんだけど導入ハードルが高いので SPCS 版はやく出てほしい!! 「まぁまぁかかった」の様子
ところが…?
SPCS 対応きました ※ 2日前