Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWS Glueで始めるETLパイプライン
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Shota Totsuka
March 04, 2025
95
0
Share
AWS Glueで始めるETLパイプライン
Shota Totsuka
March 04, 2025
More Decks by Shota Totsuka
See All by Shota Totsuka
Figma to Codeから Code to Figmaへ
totsukash
0
1.5k
コードレビューはCLAUDE.md/skillsに書け。同じ指摘を繰り返すな。
totsukash
20
19k
HITL実装によるマルチエージェント組織の設計パターン
totsukash
1
93
Claude Codeの知らない知識に立ち向かう
totsukash
1
800
Claude Codeの知らない知識、ADK, A2Aを用いた プロダクト開発をClaude Codeで行う
totsukash
0
1.3k
Claude Code で Vibe Coding
totsukash
1
94
MCP, A2Aをプロダクトに組み込んで 開発している話
totsukash
1
55
Mastra活用|Text-to-SQLの実装と応用
totsukash
1
230
Bedrockでのプロンプト管理戦略
totsukash
3
210
Featured
See All Featured
Building AI with AI
inesmontani
PRO
1
910
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.2k
Statistics for Hackers
jakevdp
799
230k
Building Adaptive Systems
keathley
44
3k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
100
Java REST API Framework Comparison - PWX 2021
mraible
34
9.3k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
94
KATA
mclloyd
PRO
35
15k
Test your architecture with Archunit
thirion
1
2.2k
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
260
Rails Girls Zürich Keynote
gr2m
96
14k
Transcript
AWS Glueで始めるETLパイプライン AWS活用 AI/ML/LLM #5 機械学習/大規模言語モデル データエンジニアリング 株式会社BLUEISH Software Engineer
戸塚 翔太 @totsumaru_dot
自己紹介 株式会社BLUEISH AI Lead Engineer @totsumaru_dot 戸塚 翔太 e 普段はLLMアプリケーションの開発をしていま
e 現在は法人向けAIエージェントプラットフォーム「BLUEISH Agents」 の開発を担当していま e 静岡県(浜松)に住んでいますが、今年中に東京へ引っ越したい...
AWS認定(今年1月から開始)
イベントを多数開催しています!
01 ETLとは? 02 AWS Glueとは? 03 GlueでETLパイプラインを組む 04 まとめ アジェンダ
01 ETLとは? 02 AWS Glueとは? 03 GlueでETLパイプラインを組む 04 まとめ アジェンダ
ETLとは? ETL(Extract・Transform・Load)
ETLとは? ETLツールを使うメリット Y データ処理にかかるコストを下げH Y データ処理におけるヒューマンエラーを防Q Y 点在するデータを統合して活用可能にすH Y データの品質向上に貢献する
01 ETLとは? 02 AWS Glueとは? 03 GlueでETLパイプラインを組む 04 まとめ アジェンダ
AWS Glueとは?
AWS Glueとは?
AWS Glueとは?
AWS Glueとは?
AWS Glueとは?
01 ETLとは? 02 AWS Glueとは? 03 GlueでETLパイプラインを組む 04 まとめ アジェンダ
GlueでETLパイプラインを組む S3 (users.csv) Glue S3
GlueでETLパイプラインを組む S3 (users.csv) 社員一覧のダミーデータをS3に用意
GlueでETLパイプラインを組む Glue クローラーの作成
GlueでETLパイプラインを組む Glue クローラー名を定義
GlueでETLパイプラインを組む Glue S3のデータソース(csv)を選択
GlueでETLパイプラインを組む Glue IAMロールの新規作成
GlueでETLパイプラインを組む Glue Database(Data Catalog)を作成
GlueでETLパイプラインを組む Glue クローラーの作成が完了 → Run
GlueでETLパイプラインを組む Glue テーブルでスキーマが表示される
GlueでETLパイプラインを組む Glue ジョブを作成 → Visual ETL
GlueでETLパイプラインを組む Glue 1つ目: データソースの選択/設定
GlueでETLパイプラインを組む Glue 2つ目: スキーマ変換
GlueでETLパイプラインを組む Glue メールアドレスを削除してみます
GlueでETLパイプラインを組む Glue 3つ目: 出力先/フォーマットの指定 → Run
GlueでETLパイプラインを組む Glue 失敗したのでポリシーを修正...
GlueでETLパイプラインを組む Glue 度重なる失敗を経て成功
GlueでETLパイプラインを組む S3 (users.csv) 最初はメールアドレスがありましたが...
GlueでETLパイプラインを組む S3 (output.csv) メールアドレスが無くなりました
01 ETLとは? 02 AWS Glueとは? 03 GlueでETLパイプラインを組む 04 まとめ アジェンダ
まとめ E Visual Editorを使うことでノーコードでの変換が可 E ただし、コードで書いてしまった方が早い場合もあ E 形式変換(parquetなど)はETLパイプラインを組む方が楽になりそう
Thank you!