Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Rust on AWS でデータ分析 / 20260523iotlt-niigata-rust...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
kasacchiful
PRO
May 23, 2026
Programming
19
0
Share
Rust on AWS でデータ分析 / 20260523iotlt-niigata-rust-on-aws
2026/05/23 (土) 開催の IoTLT新潟 Vol.17 で登壇した資料
イベントページ
https://iotlt.connpass.com/event/391502/
kasacchiful
PRO
May 23, 2026
More Decks by kasacchiful
See All by kasacchiful
上越のサメ食文化を訪ねて - 新潟市民の初体験レポ / ssmjp-shark
kasacchiful
PRO
0
30
Step Functionsで始めるサーバーレス入門 〜 つないで動かすAWSサーバーレス
kasacchiful
PRO
0
46
Amazon Q Developer CLI (現Kiro CLI) で作った 新潟ランチマップWebアプリのこれまでとこれから / 20260207jawsug-tochigi
kasacchiful
PRO
0
89
Amazon SageMaker Catalogの、AIエージェントによる自動データ分類機能を試してみようとしたが、できなかったので、代わりに最近構築したデータ連携基盤を紹介します / 20260117jawsug-fukui
kasacchiful
PRO
0
85
データファイルをAWSのDWHサービスに格納する / 20251115jawsug-tochigi
kasacchiful
PRO
2
270
テーブル定義書の構造化抽出して、生成AIでDWH分析を試してみた / devio2025tokyo
kasacchiful
PRO
0
850
ワイがおすすめする新潟の食 / 20250912jasst-niigata-lt
kasacchiful
PRO
0
55
WorkersでDiscord botを試してみた / 20250822workers-tech-talk-niigata
kasacchiful
PRO
1
150
地域コミュニティへの「感謝」と「恩返し」 / 20250726jawsug-tochigi
kasacchiful
PRO
0
280
Other Decks in Programming
See All in Programming
Structured Concurrency, Scoped Values and Joiners in the JDK 25 26 27
josepaumard
1
160
関係性から理解する"同一性"の型用語たち
pvcresin
2
280
自動レビューエンジンの実装と運用 ~レビューのない世界へ~
kurukuru1999
1
130
AWSはOSSをどのように 考えているのか?
akihisaikeda
0
130
My daily life on Ruby
a_matsuda
3
420
ローカルLLMでどこまでコードが書けるか / How much code can be written on a local LLM
kishida
2
390
開発とはなにか、Essenceカーネルで見えるもの
ukin0k0
0
200
AI駆動開発で崩れていくコードベースを立て直す
kyoko_nr_nr
0
110
エラー処理の温故知新 / history of error handling technic
ryotanakaya
7
1.9k
「OSSがあるなら自作するな」は AI時代も正しいか ── Build vs Adopt の新しい判断基準
kumorn5s
7
2.8k
Import assertionsが消えた日~ECMAScriptの仕様はどう決まり、なぜ覆るのか~
bicstone
2
190
いつか誰かが、と思っていた フロントエンド刷新5年間の実践知
kiichisugihara
1
290
Featured
See All Featured
Deep Space Network (abreviated)
tonyrice
0
150
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.6k
First, design no harm
axbom
PRO
2
1.2k
Google's AI Overviews - The New Search
badams
0
1k
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
2k
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
790
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
1.1k
エンジニアに許された特別な時間の終わり
watany
106
240k
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.3k
Code Review Best Practice
trishagee
74
20k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
230
Scaling GitHub
holman
464
140k
Transcript
None
None
None
Metadata: BuildMethod: rust-cargolambda cargo-lambda provided.al2023 [dependencies] lambda_runtime = "0.13" aws-sdk-s3
= "1" polars = { version = "0.50", features = ["lazy", "parquet", "temporal", "abs"] } tokio = { version = "1", features = ["macros", "rt-multi-thread"] }
None
None
LazyFrame::scan_parquet(input, ScanArgsParquet::default())? .with_columns([ col("timestamp").dt().truncate(lit("1h")).alias("hour"), col("temperature").mean().over([col("device_id")]).alias("_dev_mean"), col("temperature").std(1).over([col("device_id")]).alias("_dev_std"), ]) .with_columns([ ((col("temperature") -
col("_dev_mean")).abs() .gt(lit(3.0) * col("_dev_std"))).alias("_is_anomaly"), col("status").eq(lit("error")).alias("_is_error"), ]) .group_by([col("device_id"), col("hour")]) .agg([ col("temperature").mean().alias("temp_mean"), col("_is_error").sum().alias("error_count"), col("_is_anomaly").sum().alias("anomaly_count"), ]) .sort(["device_id", "hour"], SortMultipleOptions::default()) .collect()?
df["hour"] = df["timestamp"].dt.floor("h") dev_stats = df.groupby("device_id")["temperature"].agg( _dev_mean="mean", _dev_std=lambda s: s.std(ddof=1),
) df = df.merge(dev_stats, left_on="device_id", right_index=True) df["_is_anomaly"] = ( (df["temperature"] - df["_dev_mean"]).abs() > 3.0 * df["_dev_std"] ) df["_is_error"] = df["status"].eq("error") agg = (df.groupby(["device_id", "hour"], sort=True) .agg(temp_mean=("temperature", "mean"), error_count=("_is_error", "sum"), anomaly_count=("_is_anomaly", "sum")) .reset_index())
None
None
None
None
None
None
None
None
None