Satu p-value, dua cara
Anda telah melihat sebelumnya bahwa biasanya ada dua cara untuk mendapatkan sebaran nol: melalui komputasi dan melalui pendekatan matematis. Uji chi-kuadrat goodness of fit tidak terkecuali. Sebaran pendekatannya kembali berupa "sebaran Chi-kuadrat" dengan derajat kebebasan sama dengan jumlah kategori dikurangi satu.
Dalam latihan ini, Anda akan membandingkan kedua pendekatan tersebut untuk menghitung p-value yang mengukur konsistensi sebaran digit pertama Iran dengan Hukum Benford. Perhatikan bahwa statistik teramati yang Anda buat pada latihan sebelumnya tersimpan di ruang kerja Anda sebagai chi_obs_stat.
Latihan ini adalah bagian dari kursus
Inferensi untuk Data Kategorik di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Compute degrees of freedom
degrees_of_freedom <- ___ %>%
# Pull out first_digit vector
pull("first_digit") %>%
# Calculate n levels and subtract 1
___
# Plot both null dists
___
# Add density layer
___
# Add vertical line at obs stat
___
# Overlay chisq approx
stat_function(fun = dchisq, args = list(df = ___), color = "blue")