Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データ分析をはじめよう/lets_start_data_analysis

 データ分析をはじめよう/lets_start_data_analysis

Avatar for florets1

florets1

April 16, 2026

More Decks by florets1

Other Decks in Business

Transcript

  1. 6 平均値 vs 中央値 データ:10, 12, 13, 15, 1000 平均値:210

    中央値:13 どちらが実態に近い? 中央値は外れ値の影響を受けにくい →頑健(ロバスト)
  2. 8 分散・標準偏差 データ:10, 12, 14 偏差: 10-12, 12-12, 14-12 分散:偏差の2乗の平均

    標準偏差:分散の平方根 1 3 (10 − 12)2+(12 − 12)2+(14 − 12)2
  3. 9 可視化(ヒストグラム) x <- rnorm(500, mean=0, sd = 1) hist(x)

    データの要約だけではなく 分布の形をみる。
  4. 10 可視化(箱ひげ図) x <- rnorm(500, mean=0, sd = 1) y

    <- rnorm(500, mean=1, sd = 2) boxplot(list(x=x, y=y)) 複数の分布を比較