Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
カイ二乗検定との遭遇/The_path_to_encountering_the_chi-squ...
Search
florets1
July 11, 2024
Marketing & SEO
350
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
カイ二乗検定との遭遇/The_path_to_encountering_the_chi-square_test
florets1
July 11, 2024
More Decks by florets1
See All by florets1
データ分析をはじめよう/lets_start_data_analysis
florets1
2
1k
なぜSQLはAIぽく見えるのか/why does SQL look AI like
florets1
0
740
Tableauとggplot2の背景/Background_of_Tableau_and_ggplot2
florets1
0
87
Rで学ぶデータハンドリング入門/Introduction_to_Data_Handling_with_R
florets1
0
160
人工知能はクロスジョインでできている/AI_Is_Built_on_Cross_Joins
florets1
0
110
仮説の取扱説明書/User_Guide_to_a_Hypothesis
florets1
4
480
複式簿記から純資産を排除する/eliminate_net_assets_from_double-entry_bookkeeping
florets1
1
490
カイ二乗検定は何をやっているのか/What_Does_the_Chi-Square_Test_Do
florets1
7
2.5k
直積は便利/direct_product_is_useful
florets1
3
490
Other Decks in Marketing & SEO
See All in Marketing & SEO
SEO Além do Google: A Ascensão do GEO e os Fundamentos para Dominar as Buscas com IA
felipebazon
0
170
The AI Search Showdown - Zach Chahalis - Digital Summit Tampa 2026
zjchahalis
1
240
What AI Means for Brands: How to Stay Visible, Relevant, and Chosen
aleyda
3
190
Breaking the template: Subverting AI copywriting frameworks for SERP differentiation
emilyhilltraining
0
160
AI Search: Where are we so far and how to win in the current landscape
aleyda
2
630
Becoming a Community Manager in 2026 (YouTube Live Q&A + practical guidance)
mfonobong
4
170
ExpoEcomm 2026: Do SEO ao GEO como a IA está Mudando o Comportamento de Busca dos Brasileiros e o que Fazer para Vender Mais
felipebazon
1
130
LLM visibility and AI-driven search: what replaces “rankings” as the primary KPI - BrightonSEO April 2026
decabbit
1
460
SEO and Brand Sitting In A Tree K-I-S-S-I-N-G - By Lidia Infante for Digital PR Summit 2026
lidiainfante
0
260
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
150
Baidu Mobile SEO in the Age of WeChat
owainlw
0
190
Ecommerce AI Search Trends & Wins: How to optimize the evidence-to-click layer across AI Search
aleyda
0
440
Featured
See All Featured
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Building AI with AI
inesmontani
PRO
1
1.1k
sira's awesome portfolio website redesign presentation
elsirapls
0
270
4 Signs Your Business is Dying
shpigford
187
22k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.7k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
860
What the history of the web can teach us about the future of AI
inesmontani
PRO
1
610
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.8k
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
1.1k
Agile that works and the tools we love
rasmusluckow
331
21k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
The agentic SEO stack - context over prompts
schlessera
0
800
Transcript
1 2024.07.13 Tokyo.R #114 カイ二乗検定との遭遇
2 コインが偏ってないか調べる(1) 確率𝑝で表が出るコインを𝑛回投げる。 表が出る回数は二項分布𝐵(𝑛, 𝑝) に従う 分布の形状はパラメーターによって変化する B(10, 0.8) B(10,
0.5)
3 コインが偏ってないか調べる(2) パラメーターは確率分布ではない流儀 0.5 p パラメーター𝑝は0.5に近いのか それとも遠いのか、なんとも言 えない。 パラメーターは確率分布だとする流儀 0.5
パラメーター𝑝は0.5に近いのか それとも遠いのか、分布の形状 から判断できる。 二項分布𝐵(𝑛, 𝑝) のパラメーター𝑝 に注目 p
4 コインが偏ってないか調べる(3) 実際に観測された値、もしくはそれよりも極端な値が観測される確率(P値)を求めて… パラメーターは確率分布ではない流儀では仮説検定を行う 例えば二項検定
5 サイコロが偏ってないか調べる(1) サイコロの1の目が出る回数の確率は二項分布に従う 分布の形状はパラメーターによって変化する B(n=10, p=1/6)
6 サイコロが偏ってないか調べる(2) パラメーターは確率分布だとする流儀 1/6 パラメーター𝑝は1/6に近いのか それとも遠いのか、分布の形状 から判断できる。 6個のパラメーターそれぞれに ついて、1/6に近いのか遠いのか 判断してやればよい。
p
パラメーター𝑝は1/6に近いのか それとも遠いのか、なんとも言 えない。 7 サイコロが偏ってないか調べる(3) パラメーターは確率分布ではない流儀 1/6 6個のパラメーターそれぞれに ついて、1/6に近いのか遠いのか 仮説検定をすればよい。
p
8 サイコロが偏ってないか調べる(4) パラメーターは確率分布ではない流儀 6個のパラメーターそれぞれに ついて、1/6に近いのか遠いのか 仮説検定をすればよい。 多重検定
9 サイコロが偏ってないか調べる(5) 多重検定やりたくないなあ ではどうするか 素直に考えたら 多項分布を使って検定すればよさそう 多項分布は二項分布を多クラスに拡張した分布だから しかし、なぜかこの手法は流行っていないようだ 実際に流行ってるのはカイ二乗検定
10 カイ二乗分布とは 標準正規分布の二乗和の分布
11 二項分布からカイ二乗分布へ nが十分に大きいとき、二項分布𝐵(𝑛, 𝑝) は 正規分布𝑁(𝑛𝑝, 𝑛𝑝 1 − 𝑝
) で近似できる。 確率変数𝑋が二項分布𝐵(𝑛, 𝑝)に従うとき 𝑋−𝑛𝑝 𝑛𝑝(1−𝑝) は近似的に標準正規分布に従う。 標準正規分布の二乗和はカイ二乗分布 𝜒2 = (𝑋 − 𝑛𝑝)2 𝑛𝑝(1 − 𝑝)
12 カイ二乗検定とは サイコロの目 1 2 3 4 5 6 合計
実測値 24 20 18 19 17 22 120 理論値 20 20 20 20 20 20 120 ズレ (24 − 20)2 20 (20 − 20)2 20 (18 − 20)2 20 (19 − 20)2 20 (17 − 20)2 20 (22 − 20)2 20 (24 − 20)2 20 + (20 − 20)2 20 + (18 − 20)2 20 + (19 − 20)2 20 + (17 − 20)2 20 + (22 − 20)2 20 = 𝜒2 実測値と理論値のズレの和がカイ二乗分布に従っている ことを利用する検定
13 まとめ パラメーターは確率分布だとする 流儀は単純だと思う パラメーターの分布を見比べるだけ どのパラメーターが偏っているかも個別にわかる
14 まとめ パラメーターは確率分布ではない流儀は複雑だと思う パラメーター同士を直接比べてもが近いのか遠いのかなんとも言えない→仮説検定 二項分布に従う現象だから二項検定を6回やったら→多重検定 二項分布の多クラス拡張である多項分布で検定すれば→流行ってない 二項分布を正規分布で近似して、標準正規分布の二乗和が従う分布(カイ二乗分布) を使って検定する どのパラメーターが偏っているか個別にはわからないが、サイコロが偏っていること はわかる