Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
多重比較/相関分析 / Multiple Comparison and Correlation...
Search
Kenji Saito
PRO
January 18, 2025
Technology
0
59
多重比較/相関分析 / Multiple Comparison and Correlation Analysis
早稲田大学大学院経営管理研究科「企業データ分析」2024 冬の第11-12回で使用したスライドです。
Kenji Saito
PRO
January 18, 2025
Tweet
Share
More Decks by Kenji Saito
See All by Kenji Saito
続・インクルーシブな社会へ / Continuing Towards an Inclusive Society
ks91
PRO
0
10
AGI (人工一般知能) と創る新しく奇妙な社会 / New and Stranger Society built with AGI
ks91
PRO
0
53
回帰分析/大規模言語モデルと統計 / Regression Analysis, Large Language Models and Statistics
ks91
PRO
0
60
アカデミーキャンプ 2025冬「考えるのは奴らだ」 / Academy Camp 2025 Winter - Live and Let Think DAY 3
ks91
PRO
0
55
アカデミーキャンプ 2025冬「考えるのは奴らだ」 / Academy Camp 2025 Winter - Live and Let Think DAY 2
ks91
PRO
0
42
アカデミーキャンプ 2025冬「考えるのは奴らだ」 / Academy Camp 2025 Winter - Live and Let Think DAY 1
ks91
PRO
1
68
インクルーシブな社会へ / Toward an Inclusive Society
ks91
PRO
0
14
P 値と有意差/分散分析 / P-value, Significant Difference and Analysis of Variance
ks91
PRO
0
64
関連2群のt検定/独立2群のt検定 / Related 2-group t-test and independent 2-group t-test
ks91
PRO
0
71
Other Decks in Technology
See All in Technology
ビジネスと現場活動をつなぐソフトウェアエンジニアリング~とあるスタートアッププロダクトの成長記録より~
mizunori
0
130
バックエンドエンジニアのためのフロントエンド入門 #devsumiC
panda_program
16
5.2k
Kubernetesでメールの大量配信をしている話/k8sjp-20250205
hfukamachi
0
360
Nekko Cloud、 これまでとこれから ~学生サークルが作る、 小さなクラウド
logica0419
2
150
現場の種を事業の芽にする - エンジニア主導のイノベーションを事業戦略に装着する方法 -
kzkmaeda
2
550
AndroidデバイスにFTPサーバを建立する
e10dokup
0
220
現場で役立つAPIデザイン
nagix
19
6.4k
プロセス改善による品質向上事例
tomasagi
0
470
Building Products in the LLM Era
ymatsuwitter
7
1.9k
Active Directory の保護
eurekaberry
7
3.8k
関東Kaggler会LT: 人狼コンペとLLM量子化について
nejumi
2
190
家電アプリ共通PF "Linova" のAPI利用とPostman活用事例ご紹介
yukiogawa
0
120
Featured
See All Featured
Producing Creativity
orderedlist
PRO
343
39k
Designing for Performance
lara
604
68k
StorybookのUI Testing Handbookを読んだ
zakiyama
28
5.5k
Documentation Writing (for coders)
carmenintech
67
4.6k
Why You Should Never Use an ORM
jnunemaker
PRO
55
9.2k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
11
930
Optimizing for Happiness
mojombo
376
70k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
20
2.4k
Mobile First: as difficult as doing things right
swwweet
223
9.3k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
120k
4 Signs Your Business is Dying
shpigford
182
22k
Visualization
eitanlees
146
15k
Transcript
Corporate data analysis — generated by Stable Diffusion XL v1.0
2024 11-12 (WBS) 2024 11-12 — 2025-01-20 – p.1/29
https://speakerdeck.com/ks91/collections/corporate-data-analysis-2024-winter 2024 11-12 — 2025-01-20 – p.2/29
1 12 2 • 2 12 2 (B A )
• 3 12 9 • 4 12 9 • 5 12 16 • 6 12 16 t • 7 12 23 2 ( ) t • 8 12 23 2 ( ) t • 9 1 6 P • 10 1 6 • 11 1 20 • 12 1 20 • 13 1 27 14 1 27 W-IOI 2024 11-12 — 2025-01-20 – p.3/29
( 20 25 ) 1 (20 ) • 2 R
( 55 ) • 3 (32 ) • 4 (14 ) • 5 ( Git) (22 ) • 6 ( ) (24 ) • 7 (1) (25 ) • 8 (2) (25 ) • 9 R ( ) (1) — Welch (17 ) • 10 R ( ) (2) — (21 ) • 11 R ( ) (1) — (15 ) • 12 R ( ) (2) — (19 ) • 13 GPT-4 (19 ) • 14 GPT-4 (29 ) • 15 ( ) LaTeX Overleaf (40 ) • 8 (12/16 ) / (2 ) OK / 2024 11-12 — 2025-01-20 – p.4/29
2 2 t 1 9 P P 10 H0 HA
k, N, ¯ ¯ x σ2 ( )MSwithin ( )MSbetween MStotal F F 2024 11-12 — 2025-01-20 – p.5/29
11 — 2 t FWER (Family-Wise Error Rate) Bonferroni (
2 t ) / Tukey-Kramer q 12 / r sxy vs. 2024 11-12 — 2025-01-20 – p.6/29
2024 11-12 — 2025-01-20 – p.7/29
5. (1) ( ) (2) 2025 1 16 ( )
23:59 JST ( ) Waseda Moodle (Q & A ) (1)(2) Discord 2024 11-12 — 2025-01-20 – p.8/29
. . . . . . 17 16 (1/17( )
) ( ) → 16 ( ) → 11 ( ) ( ) → 2 → 3 ← ( ) ( ^^;) ↑ 2024 11-12 — 2025-01-20 – p.9/29
( ) F = / ⇒ ( ) F =
MSbetween MSwithin . . . [ ] . . . . . . [ ] ⇒ 2024 11-12 — 2025-01-20 – p.10/29
O (1/n) 3 1. ∗ 40 4 * 2. ∗∗
** 3. 2024 11-12 — 2025-01-20 – p.11/29
O (2/n) 1 1 ⇒ 2024 11-12 — 2025-01-20 –
p.12/29
O (3/n) (n = 3) 1. 2. ( ) (
-1 ) 3. F F = ( ) ( ) 4. F F F F F 5% F ⇒ →( ) → 2024 11-12 — 2025-01-20 – p.13/29
K ⇒ p.228 10-17 2024 11-12 — 2025-01-20 – p.14/29
H ⇒ (research question) . . . R 7.3 7.4
7.5 1 2024 11-12 — 2025-01-20 – p.15/29
H ⇒ : https://www.nikkei-r.co.jp/pollsurvey/method.html 2024 11-12 — 2025-01-20 – p.16/29
K ⇒ : https://www.mgt.ous.ac.jp/about/management/lecture/lecture_d-02/ ↑ p p ± 1.96 p(1
− p) n 2024 11-12 — 2025-01-20 – p.17/29
p 95% : https://bellcurve.jp/statistics/course/9122.html n . . . µ 95%
(1)( 6 ) p 95% (2) x − 1.96 × σ √ n ≤ µ ≤ x + 1.96 × σ √ n (1) ˆ p − 1.96 × ˆ p(1 − ˆ p) n ≤ p ≤ ˆ p + 1.96 × ˆ p(1 − ˆ p) n (2) B(n, p) n N(np, np(1 − p)) ˆ p N(p, p(1−p) n ) x N(µ, σ2 n ) 95% 95% 95% ( ) 2024 11-12 — 2025-01-20 – p.18/29
F 2 ⇒ ( ). . . 2024 11-12 —
2025-01-20 – p.19/29
11 — 2 t FWER (Family-Wise Error Rate) Bonferroni (
2 t ) Tukey-Kramer q 2024 11-12 — 2025-01-20 – p.20/29
(1/2) 2 t t α α . . . α
(1 − α)m ( ) m 1 FWER ( t 1 α ) 5% Bonferroni ( 2 t ) αBonferroni = 0.05 m t 2024 11-12 — 2025-01-20 – p.21/29
(2/2) Tukey-Kramer (1) : (2) : σ2 ( ) (H0
) µ1 = µ2 = · · · = µk µA = µB q qA−B = ¯ xA − ¯ xB √ MSwithin 1 2 ( 1 nA + 1 nB ) µA = µB q0.05 (k, dfwithin ) < |qA−B | 2024 11-12 — 2025-01-20 – p.22/29
V ( p.248) 19 4 “ V.R” ( multcomp glht()
) (R TukeyHSD() ) p.243 “multcomp” 2024 11-12 — 2025-01-20 – p.23/29
12 r sxy ( ) vs. 2024 11-12 — 2025-01-20
– p.24/29
Pearson r ( sx sy x y ) r =
sxy sx sy = n i=1 (xi − ¯ x)(yi − ¯ y) n i=1 (xi − ¯ x)2 n i=1 (yi − ¯ y)2 r −1 +1 |r| 1 ( ) sxy sxy = n i=1 (xi − ¯ x)(yi − ¯ y) n − 1 t ( df = n − 2 t ; ) t = r n − 2 1 − r2 2024 11-12 — 2025-01-20 – p.25/29
X ( p.270) “ X.R” ( cor.test() ) p.270 (
) 2024 11-12 — 2025-01-20 – p.26/29
2024 11-12 — 2025-01-20 – p.27/29
6. (1) ( ) (2) 2025 1 23 ( )
23:59 JST ( ) Waseda Moodle (Q & A ) (1) Discord 2024 11-12 — 2025-01-20 – p.28/29
2024 11-12 — 2025-01-20 – p.29/29