Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Snowflake Openflow さわってみた
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Yuki Ishikawa
October 01, 2025
Technology
560
0
Share
Snowflake Openflow さわってみた
2025.10.01 Snowflake 中部ユーザ会 #5
https://techplay.jp/event/985802
Yuki Ishikawa
October 01, 2025
More Decks by Yuki Ishikawa
See All by Yuki Ishikawa
o11y 何もわからない助けてくれ
hoto17296
0
28
第3回 Snowflake 中部ユーザ会- dbt × Snowflake ハンズオン
hoto17296
4
1.3k
ORM と向き合う
hoto17296
14
11k
明日業務で役立たない Web 開発 TIPS
hoto17296
0
240
クソ bot 実装ライブコーディング
hoto17296
0
260
DeepGBM 論文の紹介
hoto17296
0
720
試行錯誤のための Docker 活用術
hoto17296
4
3.3k
Hive 集計テクニック
hoto17296
0
550
データ分析と Docker / Data Analysis with Docker
hoto17296
0
410
Other Decks in Technology
See All in Technology
大学生が本気でDatabricksを活用してDiscordサークルをデータ駆動させてみた
phantomjuju
1
300
はじめてのDatadog
kairim0
0
240
脅威をエンジニアリングの糧にして:恐怖を乗り越えた先にあったもの / Turn threats into fuel for engineering: what lay beyond overcoming fear
nrslib
1
360
権限管理設計を完全に理解した
rsugi
2
250
類似画像検索モデルの開発ノウハウ
lycorptech_jp
PRO
4
1.1k
TypeScript Compiler APIとPHP-Parserを活用し、TypeScriptとPHPで型を共有する
shuta13
0
270
Anthropic AIネイティブ・スタートアップ構築のプレイブック を理解する
nagatsu
0
230
プラットフォームエンジニア ワークショップ/ platform-workshop
databricksjapan
0
140
テストコードのないプロジェクトにテストを根付かせる
tttol
1
240
oracle-to-databricks-migration-with-llm-and-dbt
casek
1
380
AI フレンドリーなエラー監視を TypeScript で実現する
shinyaigeek
2
200
GoとSIMDとWasmの今。
askua
1
150
Featured
See All Featured
YesSQL, Process and Tooling at Scale
rocio
174
15k
[SF Ruby Conf 2025] Rails X
palkan
2
1.1k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
2
200
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
1.1k
Side Projects
sachag
455
43k
Marketing to machines
jonoalderson
1
5.3k
Heart Work Chapter 1 - Part 1
lfama
PRO
7
36k
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
2
380
KATA
mclloyd
PRO
35
15k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.3k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
570
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
760
Transcript
Snowflake Openflow さわってみた 2025.10.01 Snowflake 中部ユーザ会 #5 Yuki Ishikawa /
@hoto17296
注意事項 この資料のコンテンツは2025年8月に作られたものであり 2025年10月の時点でも既にちょっと情報が古いので お気をつけください
AGENDA 1. Openflow 概要 2. Openflow を試しに動かす (環境構築編) 3. Openflow
を試しに動かす (データ取り込み編) 4. 所感
Openflow 概要
Snowflake Openflow の概念 2025年6月に発表された新機能 あらゆる場所から Snowflake にデータを集約するための ETL ツール
Snowflake Openflow の実体 • Apache NiFi (ニーフィー) • データフローオーケストレーションツール •
SaaS とかのデータを「コネクタ」でとりにいったり、ワークフローを組んだり • 動作するインフラ • 現時点では AWS 上での Bring Your Own Cloud (BYOC) 版のみサポートされている • Kubernetes クラスタを自分で用意しないといけない • 公式ドキュメントの手順に従ってつくると Amazon EKS が作成される • 使用する VPC は「Openflow 用 (managed) を作る」か「既存の VPC に載せる」か選べる • 今後 Snowpark Container Services (SPCS) 版も出る予定らしい? Snowflake Openflow の実体は Kubernetes 上で動く Apache NiFi
イメージ図 Snowflake とは別のところに Kubernetes クラスタがいて、そこで ETL 処理が実行される Kubernetes クラスタ (=
Deloyment) Snowflake Runtime 他の Runtime Manager Connector • 外部リソースへの接続情報 • その他、各種設定 外部リソース User / Role Openflow 利用ユーザ • Type = PERSON • Openflow に関する権限をつける Openflow Runtime 用ユーザ • Type = SERVICE • 実行したいタスクに必要な権限をつける Database / Schema / Table • データの取り込み先 API
Openflow を試しに動かす (環境構築編)
開始! まずは Openflow 管理用のページにアクセスする Snowsight 上に管理画面があるわけではなく Openflow 管理用の別サイトに飛ばされる (なんで?)
Deployment 作成 K8s クラスタを動かす場所を選ぶ (いまはまだ AWS しか選べない) VPC どうするか選ぶ Managed
のほうが簡単 Openflow 管理者に割り当てる Role を指定する (作っておく) PrivateLink もできる
EKS クラスタ作成 (1/2) AWS Cloud Formation の スタックテンプレートが生成される スタックテンプレートを使用して リソースを作成する
(まだ EKS 作られない) スタックテンプレートの パラメータはほとんど いじらなかった
EKS クラスタ作成 (2/2) EC2 インスタンス内で OpenTofu (≒ Terraform) が 動いて
EKS クラスタが作られる 1時間くらいかかる…
Deployment が正常かどうか確認 (おそらく) EKS クラスタ内の Manager ノードが 「この Deployment は起動しているぞ」と
ping を送ってきている (それが確認できると Active になる)
Runtime を作成する Deployment さえできてしまえば Runtime の作成は超簡単
Runtime の Canvas 画面を開く (たぶん) Runtime 側が OAuth クライアントになっていて Snowflake
アカウントを使用して OAuth 認証している この Canvas 画面が開けたなら 環境構築は完了ってことで良さそう
Openflow を試しに動かす (データ取り込み編)
今回やりたいこと Google Sheets の内容を Snowflake のテーブルに取り込む 本当は「Drive 全部を Cortex Search
に取り込んで RAG チャットボット」 をやりたかったけど挫折した
使用するコネクタの公式ドキュメント https://docs.snowflake.com/en/user-guide/data-integration/openflow/connectors/google-sheets/setup
Google Cloud でプロジェクトとサービスアカウントを作成する
サービスアカウントのキー (JSON) を生成する このキーを使用することで Openflow の Runtime は サービスアカウントの権限で Google
Cloud にアクセスできる
サービスアカウントにファイルの閲覧権限を付与
Google Sheets コネクタを Runtime に追加 この中から「Google Sheets」コネクタを 選択して Runtime に追加する
※ スクショ撮り忘れた
コネクタがキャンバスに追加された
コネクタの各種パラメータを設定する 設定項目いろいろある • Google Cloud にアクセスするサービスアカウントの認証情報 • 取り込む対象ファイルの ID •
Snowflake にアクセスするユーザの認証情報 • 取り込み先のデータベース情報
いざ起動 まずは全ての コントローラサービスを 有効化する コネクタを起動
うわあああああああああああ 右上の赤いところにマウスオーバーすると エラー詳細が出る これは 「Google Sheets API が使えない」 というエラーっぽい
プロジェクトで Google Sheets API を使用できるようにする この手順、公式ドキュメントに書いてなかった ※ 2025年8月時点
もろもろ割愛 このあと2時間くらい さまざまなエラーと格闘
なんか動いているっぽい!
きたああああああああ
所感
所感 • 競合製品 (Trocco とか) との比較はできない、もうしわけない… • 「試しに動かしてみる」までのハードルまぁまぁ高い • SPCS
版はやく出てほしい、マジで • 外部サービス連携するツールなのだからコネクタ設定周りが複雑なのはもう仕方ない、頑張るしかない • 一度仕組みを作ってしまえばあとは簡単で便利なのかもしれない 今回「データを取り込む」だけならプログラムは一切書かずに済んだ • EKS クラスタを数日放置しただけでまぁまぁかかった… ($) • 動かしっぱなしだと月10万円以上かかりそう • EKS は「リソースを止めておく」のも手間なので、趣味で遊ぶにはちょっときびしい • SPCS 版はやく出てほしい、マジで (料金体系どうなるかしらんけど) 便利っぽいんだけど導入ハードルが高いので SPCS 版はやく出てほしい!! 「まぁまぁかかった」の様子
ところが…?
SPCS 対応きました ※ 2日前