Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Power BI Premiumでデータ準備!
Search
Akihiro Suto
May 03, 2022
Technology
1
970
Power BI Premiumでデータ準備!
Power BI 勉強会GW合宿 2022第壱夜~夜のデータ準備~
https://powerbi.connpass.com/event/246419/
こちらで発表した内容です。
Akihiro Suto
May 03, 2022
Tweet
Share
More Decks by Akihiro Suto
See All by Akihiro Suto
JPPC2023_BI08_セマンティックモデルを覗き見る(公開用)
hanaseleb
0
4.5k
プッシュデータセットを試してみよう
hanaseleb
0
540
レポートをつくる、その先の運用を考える🤔 Power BI Report Ops
hanaseleb
0
4.9k
Power BI データフローを考える
hanaseleb
1
1.5k
DAXクエリをDAX Studioでつくって、Power Automateで発射する💪
hanaseleb
1
2.5k
BIのPowerをAutomateする
hanaseleb
0
440
Power BI のうらがわ
hanaseleb
2
790
ゼロからはじめたPower BI
hanaseleb
1
1.2k
Power Automateドリブンのチームマネジメント
hanaseleb
0
700
Other Decks in Technology
See All in Technology
Storage Browser for Amazon S3
miu_crescent
1
210
PHPからGoへのマイグレーション for DMMアフィリエイト
yabakokobayashi
1
170
re:Invent 2024 Innovation Talks(NET201)で語られた大切なこと
shotashiratori
0
310
DevOps視点でAWS re:invent2024の新サービス・アプデを振り返ってみた
oshanqq
0
180
小学3年生夏休みの自由研究「夏休みに Copilot で遊んでみた」
taichinakamura
0
160
AI時代のデータセンターネットワーク
lycorptech_jp
PRO
1
290
レンジャーシステムズ | 会社紹介(採用ピッチ)
rssytems
0
150
20241214_WACATE2024冬_テスト設計技法をチョット俯瞰してみよう
kzsuzuki
3
520
バクラクのドキュメント解析技術と実データにおける課題 / layerx-ccc-winter-2024
shimacos
2
1.1k
プロダクト開発を加速させるためのQA文化の築き方 / How to build QA culture to accelerate product development
mii3king
1
270
podman_update_2024-12
orimanabu
1
280
LINEヤフーのフロントエンド組織・体制の紹介【24年12月】
lycorp_recruit_jp
0
530
Featured
See All Featured
Code Review Best Practice
trishagee
65
17k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
159
15k
Docker and Python
trallard
42
3.1k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.3k
Imperfection Machines: The Place of Print at Facebook
scottboms
266
13k
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
The World Runs on Bad Software
bkeepers
PRO
65
11k
Building Better People: How to give real-time feedback that sticks.
wjessup
365
19k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
Java REST API Framework Comparison - PWX 2021
mraible
28
8.3k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
28
900
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
2
290
Transcript
Power BI 勉強会 GW合宿 2022 第壱夜 夜のデータ準備
須藤 明洋 すとう あきひろ 秋田県 出身 集英社 勤務 Power BI
2021.04~ Python 2021.09~ Rugby 1991.04~ Kendama 2020.04~
Power BI Premiumでデータ準備
• Power BI Premiumの一部機能をご紹介 ◦ 💎配置パイプライン ◦ 💎データフロー ◦ 💎高度なAI
◦ 💎機械学習 Power BI Premiumでデータ準備
配置パイプライン
• BI 作成者は組織のコンテンツのライフサイクルを管理 ◦ 開発環境→テスト環境→プロダクション環境 ◦ パラメーターの管理 ◦ データベースの変更 配置パイプライン
None
None
None
None
None
None
None
None
None
None
None
None
None
None
• 開発環境 100行 ◦ インポートしたときに作業しやすい • テスト環境 1,000,000行 ◦ 前年比など確認
• 運用環境 1,000,000,000行 → 全データ 配置パイプライン
• 開発環境 100行 ◦ インポートしたときに作業しやすい • テスト環境 1,000,000行 ◦ 前年比など確認
• 運用環境 1,000,000,000行 → 全データ 配置パイプライン Power BI Desktop Power BI Service
Dataflow
• Power BI 内の多くのデータセットおよびレポートで共有できる再利用 可能な変換ロジックを作成できる。 ◦ Power Query Online •
独自の Azure Data Lake Storage Gen 2 内にデータが公開される。 Dataflow
None
• データフローを使用することで、データソースに何度もアクセスされる ことを防ぐことができる。 → Azure Data Lake Storage Gen2 にアクセス
Dataflow
None
None
None
• データフローを使用することで、データソースに何度もアクセスされる ことを防ぐことができる。 → Azure Data Lake Storage Gen2 にアクセス
• アクセス負荷軽減 • セキュリティ • 権限設計 Dataflow
Power BI Premium の Dataflow
• 💎処理の高速化 • 💎増分更新 • 💎リンクテーブル • 💎計算テーブル Power BI
Premium の Dataflow
💎処理の高速化
• Power BI Pro ◦ ベスト エフォート • Power BI
Premium ◦ 専用容量が割り当てられる →処理が早い 💎処理の高速化
💎処理の高速化 • Pro環境 • Premium環境 データ読込速度比較
💎処理の高速化 • Pro環境:更新時間の制限 ◦ 個々のエンティティのレベルで 2 時間 ◦ データフロー全体のレベルで 3
時間
None
💎処理の高速化 • Premium環境:更新時間の制限 ◦ データフロー全体のレベルで 24 時間
None
• 例が良くない ◦ すみません • 体感時間 ◦ 半分くらい 💎処理の高速化
💎増分更新
• Datasetの増分更新 ◦ Proライセンスでも可能 • Dataflowの増分更新 ◦ Premiumライセンスが必要 💎増分更新
• 更新が高速化される • 更新の信頼性が高くなる • リソースの使用が減る 💎増分更新
None
None
None
None
💎リンクテーブル&💎計算テーブル
• 💎リンクテーブル ◦ 既存のデータフローを参照する。 ◦ 複数のデータフロー内で再利用できるテーブルを作成する。 💎リンクテーブル&💎計算テーブル
None
None
None
• 💎計算テーブル ◦ リンク テーブルを参照し、書き込み専用の方法でそのテーブルに 対して操作を実行する。 ◦ その結果として新しいテーブルが作成される。 💎リンクテーブル&💎計算テーブル
None
None
データフローを使用してデ ータ ウェアハウスを作成す るためのベスト プラクティ ス - Power Query |
Microsoft Docs
データフローを使用してデータ ウェアハウスを作成する ためのベスト プラクティス - Power Query | Microsoft Docs
シナリオに沿って紹介 ◦ 夏のフェア 『ナツコミ』 ◦ Twitterの反応を可視化したい 💎リンクテーブル&💎計算テーブル
None
None
None
データ前処理
高度なAI
• テキストアナリティクス • 画像へのタグ付け 高度なAI
• テキストアナリティクス 自然言語処理 ◦ 言語の特定 ◦ キーフレーズ抽出 ◦ 感情スコア 高度なAI
None
None
None
None
None
None
データ前処理
データ前処理
• 更新のオーケストラレーション ◦ 同じワークスペースに存在する場合 ◦ 上流のデータが更新されると下流のリンクテーブル、計算テーブル は順次更新される。 💎リンクテーブル&💎計算テーブル
None
None
None
None
None
None
None
None
機械学習
• 経験からの学習により自動で改善するコンピューターアルゴリズム 機械学習 機械学習 - Wikipedia
• Power BI のAutoML ◦ 二項分類 ◦ 多項分類 ◦ 回帰
機械学習 データフローと共に Machine Learning と Cognitive Services を使用する - Power BI | Microsoft Docs
DEMO Diamond データセット カラット カラーなどから 価格を予測する 機械学習 pycaret/pycaret: An open-source,
low-code machine learning library in Python (github.com)
None
ほかにも、 • データフローへのダイレクトクエリ • ページ分割されたレポート • 最大48回更新 などなど Power BI
Premium 便利! Power BI Premium の機能。 - Power BI | Microsoft Docs
ほかにも、 • データフローへのダイレクトクエリ • ページ分割されたレポート • 最大48回更新 などなど Power BI
Premium 便利! Power BI Premium の機能。 - Power BI | Microsoft Docs もう戻れない
None