Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
BigQueryの簡単データ参照
Search
chimame
December 08, 2019
Programming
1
430
BigQueryの簡単データ参照
GDG DevFest Osaka 2019
chimame
December 08, 2019
Tweet
Share
More Decks by chimame
See All by chimame
RemixでVersion skewに立ち向かう
chimame
1
880
私がエッジを使う理由
chimame
10
4k
GraphQL Server on Edge after that
chimame
1
1.4k
Accelerating App Dev with Cloudflare Workers
chimame
1
400
GraphQL Server on Edge
chimame
12
5.7k
エッジで輝くフロントエンド
chimame
11
6.6k
Cloudflare Workersと状態管理
chimame
4
1.6k
CSRなサイトを (疑似的な)ISRに変更した話
chimame
0
580
Cloud Runマネージドに適したアプリケーションを考える
chimame
1
290
Other Decks in Programming
See All in Programming
asdf-ecspresso作って 友達が増えた話 / Fujiwara Tech Conference 2025
koluku
0
1.4k
BEエンジニアがFEの業務をできるようになるまでにやったこと
yoshida_ryushin
0
200
オニオンアーキテクチャを使って、 Unityと.NETでコードを共有する
soi013
0
370
Запуск 1С:УХ в крупном энтерпрайзе: мечта и реальность ПМа
lamodatech
0
950
サーバーゆる勉強会 DBMS の仕組み編
kj455
1
300
Beyond ORM
77web
11
1.6k
週次リリースを実現するための グローバルアプリ開発
tera_ny
1
1.2k
ISUCON14感想戦で85万点まで頑張ってみた
ponyo877
1
590
快速入門可觀測性
blueswen
0
500
Flatt Security XSS Challenge 解答・解説
flatt_security
0
730
為你自己學 Python
eddie
0
520
PHPUnitしか使ってこなかった 一般PHPerがPestに乗り換えた実録
mashirou1234
0
420
Featured
See All Featured
Thoughts on Productivity
jonyablonski
68
4.4k
VelocityConf: Rendering Performance Case Studies
addyosmani
327
24k
Facilitating Awesome Meetings
lara
51
6.2k
Building a Modern Day E-commerce SEO Strategy
aleyda
38
7k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
365
25k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
27
1.5k
GitHub's CSS Performance
jonrohan
1030
460k
Unsuck your backbone
ammeep
669
57k
How to Ace a Technical Interview
jacobian
276
23k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
28
2.2k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
98
18k
The Cost Of JavaScript in 2023
addyosmani
46
7.2k
Transcript
BigQueryの 簡単データ参照 2019/12/08 GDG DevFest Osaka 2019 rito
Agenda ❏ 自己紹介 ❏ 以前のビッグデータ分析基盤 ❏ ビッグデータ出力の検討 ❏ Connected Sheetsの特徴
❏ まとめ 2
自己紹介 名前: rito 職業: Webエンジニア (アプリケーションエンジニア) 分野: Ruby on Rails,
Nodejs, React, Docker, AWS, GCP 所属: Ateam Finergy Inc. コミュニティ: GDG Osaka Rails follow-up Osaka Osaka Web Developers Meetup twitter: @chimame_rt GitHub: chimame 3
以前のビックデータ分析 基盤
構成 5 Amazon RDS Amazon Redshift Amazon RDS Amazon RDS
構成 6 Amazon RDS Amazon Redshift Amazon RDS Amazon RDS
各システムで保持しているデータをRedshiftに 集約
7 Amazon RDS Amazon RDS Amazon RDS 構成 Amazon Redshift
独自に構築したアプリケーションからデータを 参照・取得することが可能
8 Amazon RDS Amazon Redshift Amazon RDS Amazon RDS 構成
Microsoftが生み出した強力BIツールのExcel でデータをこねくり回す
以前のビッグデータ基盤の課題 ❏ アプケーションが作成されたのは2013年 ❏ ExcelのためのCSV出力機能でくそデカイデータ を落とすとメモリが足りず落ちる ❏ Redshiftって結構お高いです 9
そもそもこんな古いアプリケーション 面倒見たくない!!! 10
11 よろしいならば移行だ (言い出しっぺがやる法則)
12
ビックデータ出力の 検討
構成 14 Amazon RDS BigQuery Amazon RDS Amazon RDS New
とりあえずRedshift剥がして BigQueryにデータ入れるところから検討 15
16
選定理由 ❏ リアルタイムに連携する必要はない ❏ DigdagはEmbulkの再実行やエラーハンドリン グが楽 ❏ BigQueryはデータ”更新”が容易ではないので更 新ジョブも必要になり、Digdagでジョブフローとし て管理できるため
17
ここまでは簡単簡単 18
データは入れたら終わりじゃない 19
データは取り出せないと意味がない 20
しかもエンジニア以外にも 簡単に参照させる 21
Try1. Metabase 22
Amazon RDS Amazon RDS Amazon RDS 構成 23 BigQuery New
よかった点 ❏ BigQueryへのコネクタも標準で搭載 ❏ データのビジュアライズツールのおかげでエンジ ニア以外も簡単にデータ取得できる(SQL不要) 24
選択しなかった理由 ❏ 吐き出されるSQLではBigQueryのパーティショ ン分割テーブルに対応できない ❏ データをこねくり回すにはCSV出力してExcelを使 わなければならず、単体では厳しい 25
Try2. BigQuery to Spread Sheets by BigQuery data connecter 26
Amazon RDS Amazon RDS Amazon RDS 構成 27 BigQuery New
よかった点 ❏ 標準機能として提供されている安心感 ❏ セットアップいらずですぐに使用が開始できる 28
選択しなかった理由 ❏ データ取得にはSQLが必要 ❏ 取得できたとしても最大1万行という制約 29
Try3. BigQuery to Spread Sheets by Google Apps Script 30
Amazon RDS Amazon RDS Amazon RDS 構成 31 BigQuery New
よかった点 ❏ 標準のBigQuery data connecterの1万行制 限を超えることができる 32
選択しなかった理由 ❏ プログラムの配布が面倒(アドオン配布 ❏ 標準のBigQuery data connecterより重い ❏ SQLがやっぱり必要になる 33
どれもいい案とは言えない 34
Google Cloud Next'19 で発表された Connected Sheetsの存在は知ってた 35
過去にβ使用の申請はあげていが まだリリースされない 36
(メールを貼り付ける) 37
(メールを貼り付ける) 38 意訳) もうちょっとであなたのドメインでConnected Sheets 使えるようになるから待ってて(はぁと
さっそく試す 39
Connected Sheets の特徴
“ 41 Connected Sheetsとは ◂ 数百億行でもスプレッドシートの表として使用 可能 ◂ SQLが不要 ◂
スプレッドシート同様に式、グラフ、ピボットと して使用可能
Amazon RDS Amazon RDS Amazon RDS 構成 42 BigQuery New
Connected Sheets
実際の使用イメージ 43
44 メニュー→データ→データコネクタ→BigQueryに接続 と選択していく
45 プロジェクト→データセット→テーブル と選択していく
46 これだけで2.4億行のデータを参照可能
47
48 2.4億行のデータ元にピボットテーブルの作成 が可能
49
50 2.4億行の内最大で5万行のROWデータを取 得が可能
求めたてのはコレ!!!! 51
まとめ
まとめ ◂ ビッグデータを格納・集約するのも大事だが、取り 出しも容易にできることを考える必要がある ◂ Connected Sheetsを使えば今までの BigQuery連携とは違いSQLいらずなのでエンジ ニア以外も気軽に使うことができる ◂
BigQuery上のROWデータを使えばスプレッド シートの最大セル数をあっという間に上限になる ので用法用量を持って使う 53
54 Thanks! ご清聴ありがとうございました。 ◂ rito ◂ @chimame_rt