Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
TS-S205_昨年対比2倍以上の機能追加を実現するデータ基盤プロジェクトでのAI活用について
Search
K.Mitsuhashi
September 12, 2025
Technology
1
91
TS-S205_昨年対比2倍以上の機能追加を実現するデータ基盤プロジェクトでのAI活用について
SnowflakeWorldTourTokyo2025. Theater Session 16:20-16:35
K.Mitsuhashi
September 12, 2025
Tweet
Share
More Decks by K.Mitsuhashi
See All by K.Mitsuhashi
我が社のデータエンジニアリング現場#Chatwork編_2024/05/22
kaz3284
0
2.2k
実用的なデータ分析基盤について(個人的に思うカジュアルトーク)
kaz3284
2
1.9k
Other Decks in Technology
See All in Technology
AWSを利用する上で知っておきたい名前解決のはなし(10分版)
nagisa53
10
3.1k
Platform開発が先行する Platform Engineeringの違和感
kintotechdev
4
560
自作JSエンジンに推しプロポーザルを実装したい!
sajikix
1
170
2つのフロントエンドと状態管理
mixi_engineers
PRO
3
100
20250913_JAWS_sysad_kobe
takuyay0ne
2
180
ChatGPTとPlantUML/Mermaidによるソフトウェア設計
gowhich501
1
130
Terraformで構築する セルフサービス型データプラットフォーム / terraform-self-service-data-platform
pei0804
1
170
エラーとアクセシビリティ
schktjm
1
1.2k
EncryptedSharedPreferences が deprecated になっちゃった!どうしよう! / Oh no! EncryptedSharedPreferences has been deprecated! What should I do?
yanzm
0
270
COVESA VSSによる車両データモデルの標準化とAWS IoT FleetWiseの活用
osawa
1
270
S3アクセス制御の設計ポイント
tommy0124
3
200
サンドボックス技術でAI利活用を促進する
koh_naga
0
200
Featured
See All Featured
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
RailsConf 2023
tenderlove
30
1.2k
Designing for humans not robots
tammielis
253
25k
Code Review Best Practice
trishagee
70
19k
Why You Should Never Use an ORM
jnunemaker
PRO
59
9.5k
Why Our Code Smells
bkeepers
PRO
339
57k
Thoughts on Productivity
jonyablonski
70
4.8k
The World Runs on Bad Software
bkeepers
PRO
70
11k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
920
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
51
5.6k
Transcript
みっつ(三ツ橋和宏) Staff Data Engineer | 株式会社kubell 昨年対比2倍以上の機能追加を実現する データ基盤プロジェクトでのAI活用につ いて TS-S205
アジェンダ • kubellのデータ分析基盤について • 開発を加速するAI活用について • データ利活用を加速するAI活用について • まとめ •
資料集
3 Staff Data Engineer 株式会社kubell(旧Chatwork) みっつ(三ツ橋和宏) ◦Snowflake活動 ❄Data Superhero'25、'24、'23 X:@kaz3284
←この資料も後で公開予定(できるだけ)!
kubellのデータ分析基盤について
5 Snowflakeを中心としたデータ分析基盤 Chatwork システム Treasure CDP Salesforce market zendesk …etc
DWH Data モデル 取り込み 取り込み 取り込み 利用 実装・制御 SSOT(Single Source of Truth) dbt, Dagster BIツール各種 Streamlit Notebook
6 現在は並列型の体制(直列型のボトルネックを解消した後) 我々(DRE)は以下を提供してサポート • 横串の共通プラットフォーム機能 • 設計・開発・運用支援 利用現場が主体で開発を進めることができる体制(DIY) 共通プラットフォームは、横串で開発をスケールさせる機能を持つ。 •
メタデータ管理 • IaC、CI/CD、DevSecOps(情報統制を含むDevOps) 前提として必要なのは、現場部門に開発を進める技術があること • dbtとdevcontainer(Cursor)により、SQLとgithubが使えるくらいがあればOKのス キルで開発可能となっている cf.直列型 ◦詳細について:次世代データ分析基盤のさらなる飛躍を目指して
7 2024は、前年比2.5倍の機能追加+αを実現 • 機能追加数の大幅増加: 2023年の機能追加数が約80件に対し、2024年は約200件と2.5倍を達成。 • アナリスト主導の新機能開発: Reverse ETLを活用して、アナリストのみで新機能を実現した。 •
迅速なデータ基盤立ち上げ: グループ会社のデータ基盤を1週・人程度で立ち上げ。(工期は約2週間程度) • レポート作成の効率化: Streamlitの導入により、顧客向けレポート作成の工数が大幅に削減。
8 2025の状況について... AIを本格的に活用し始めて... 8月までに去年を超える280件超の機能追加を実現済み。(2024 年は年間で約200件) 2年連続2倍以上の成長も夢ではない状況できており... 本日は、kubellのデータ基盤開発でのAIの活用について 「開発を加速する」と「データの利活用を加速する」 2つの観点から紹介。
開発を加速するAI活用について
10 開発を加速するAI活用 AIエディタ(Cursor)とAIエージェント(Devin)を適材適所で使い分け • AIエディタ(Cursor)は、導入して一番使ってきたツール。 ◦ あらゆる開発で使える。 モデル(とモード)選択、ピンポイント指示とコー ド生成ができるため小回りが効いく。 ◦
反面、 やることが決まっている定型開発は手間がかかる • AIエージェント(Devin)は、自律型エージェントとして型化された定型処 理で活用 ◦ 指示を数行書くだけでPRを作ってくれる。 カラム追加、カラム型変更...etc ◦ 使用量課金なので、広く使ってもらえる(ライセンス課金のCursorと違い) ◦ 反面、しっかり型化されてないと手戻りが大きくなって余計な手間がかかる
11 開発全般で活用する。AIエディタ(Cursor)。その1 アナリティクスエンジニア、データエンジニアは全員が活用中。 もはや手放せない開発ツールになっている。 • データモデルの開発で役割 ◦ アナリティクスエンジニアは、分析モデル層(緑)開発で活用 ◦ データエンジニアは、取り込み層(黄)開発で活用
◦ dbtのモデル数は400程度
12 開発全般で活用する。AIエディタ(Cursor)。その2 • Snowflake MCP Server (Cursorと組み合わせて) ◦ Cursorから開発環境へ接続して、独自構成を理解したクエリを生成できる ◦
クエリ生成時にdocsを調べたり試行錯誤する必要がほとんど無くなる。 -> 特にSnowflake(データベース)を使う指標などを見るのが楽に。 ◦ 参考になる投稿:Snowflake MCP Server で Cursor から高度なデータ分析を実現する • オーケストレーションの開発(Dagster) ◦ 初期実装(キャッチアップ)に時間に苦戦していたが、Cursorを使って一気に進展し た。 ◦ 高機能なモデルを選択して実装精度が上がった。 • TerraformのIaC実装 ◦ 新機能の追加はCursorで、定型化された機能追加はDevinで実行するように。
13 AIエージェント(Devin)定型の機能追加で活用中 開発の生産性をさらに上げるために導入。(有効な活用方法は模索中) • 良いところ ◦ (明確にやることが決まった)定型の機能追加は全自動で完遂できる ◦ コーディングが不要になる。数行の指示でPR作成、コメントに対する修正もレンス ポンスよく対応してくれる。
• 使いどころを選ぶところ ◦ やることが決まった定型の機能追加は少ない現実... ◦ 曖昧なコンテキストや指示で動くと、間違った方向で実装してしまう... ▪ 人手でリカバリしたり、確認が必要となってしまう しばらくは、Jrレベルのお手伝い者として使うイメージ。 上手く機能してもらうには、先ず型化されてないところを整備するところらスタートする必要 がある💦 Snowflake MCP Serverと連動すると、任せられる領域が広がりそうな感じはしている🤔
データ利活用を加速するAI活用について
15 データ利活用を加速するAI活用 Snowflakeデータ基盤のデータを、誰でも気軽に利活用できるよう支援するAI活用 ユーザはプロダクト開発部門やセールス部門、サポート部門の方々。 • Copilot(Inline含む): ◦ WebUIからすぐに使える。 PdMやプロダクト開発者が、クエリを実行する際によく使われる。 必要なデータをDIYできる(アナリストが用意するダッシュボードからは見えない詳細をドリ
ルダウン分析するときなど) • Streamlit in Snowflakeのデータアプリ: ◦ Snowflake上でサッとデータアプリを作れる。 現場にあったら便利かもと思う機能をStreamlit+Cortexでサッと作って使ってもらうみたい な検証ができる。 実際に、セールスの商談状況を要約するアプリは業務で活用するイメージを素早く実現でき た。 ◦ StreamlitはLLMコーディングとの相性が良いのもポイント。 • Snowflake Notebook: ◦ ガバナンスが整ったSnowflakeで完結するデータ処理環境を実現できる。 個人情報の扱いに細心の注意が必要な昨今において、安心した環境でスグにMLなどを実行で きる環境を提供できる。
16 その他、注目している機能 • Cortex AISQL: 今年のSummitで発表された注目の機能。(現地参加者でも話題になった) AI_FILTER、AI_CLASSIFY、AI_COMPLETEなど、 クエリの中にプロンプトを埋め込んでSQLとAIを同時に実行することができる。 ◦ サポート業務の支援や、利用アンケートの分析などが効率化しそう
◦ SQLxAIの掛け算で、足し算以上の新しいことができそう 参考になる投稿:SQLでAI分析!Snowflake Cortex AISQLの使い方とユースケース8選 • AI_EXTRACT, AI_PARSE_DOCUMENT: 契約書や非定型な文章をAIを通してデータベース化したり、必要な部分のみ抽出できる。 ◦ 事務作業をDX化する取り組みなどで活用できそう。 ◦ SQL関数として手軽に使える(DocumentAIによりも簡単に使える) ◦ 日本語対応もありがたい。 参考になる投稿:Snowflake新AI関数: 日本語対応のAI_EXTRACTとAI_PARSE_DOCUMENTを使ってみた • Snowflake Intelligence: マーケットプレイスからCKE(CortexSearchの一種)を取り込むと 参考になる投稿:[新機能]Cortex Knowledge Extensionsが一般提供!MarketplaceからSnowflake公式ドキュ メントのExtensionsを取得してSnowflake Intelligenceから問い合わせをしてみた
まとめ
18 まとめ • kubellのデータ分析基盤は2021年から、Snowflakeへの移行を決断してモダ ン化を進めてきた。 • 2024年は、開発体制の移行に成功して、2.5倍の機能成長と全社利用が進ん だ。 • 今年は、開発やデータ利活用にAIを導入して成長が加速している。
(8月までで既に昨年比1.5倍のペースで成長中) • 今年の成長はAIエディタやエージェントの導入と、Snowflakeで使えるAI機 能を積極的に活用できたところにある。 • AIとデータ基盤は密接な関わりがある(と個人的には思っている) これからもAIと共に成長していきたい!
19 [お知らせ]みん強第5回 09/24(水)19:30 〜ハイブリッド開催 みんなの考えた最強のデータ基盤アーキテクチャ第5回 〜オールスター大集合スペシャル!!〜 • これまで4回の合計で、参加者が4,000名を超えたデータエンジニアのイベント最新回を開催! • 現地参加限定。菱沼さん・吉田さん始めなかなか話せない方と話せます
資料集
21 資料集 • 参考になる投稿 ◦ Snowflake MCP Server で Cursor
から高度なデータ分析を実現する ◦ SQLでAI分析!Snowflake Cortex AISQLの使い方とユースケース8選 ◦ Snowflake新AI関数: 日本語対応のAI_EXTRACTと AI_PARSE_DOCUMENTを使ってみた ◦ [新機能]Cortex Knowledge Extensionsが一般提供!Marketplaceから Snowflake公式ドキュメントのExtensionsを取得してSnowflake Intelligenceから問い合わせをしてみた • kubellのデータ分析基盤について ◦ 次世代データ基盤プロジェクトへのAI導入とSnowflakeブートキャンプについて ◦ 次世代データ分析基盤のさらなる飛躍を目指して ◦ 『我が社のデータエンジニアリング現場』を開催!イベントレポートをまとめま した ◦ 利用拡大へ向けてステップアップを目指す次世代データ分析基盤開発について ◦ プロダクトへの貢献を目指す、Chatworkの次世代データ分析基盤
THANK YOU