Un p-value, due modi
Hai già visto che di solito ci sono due modi per ottenere la distribuzione nulla: tramite calcolo computazionale e tramite un'approssimazione matematica. Il test di bontà di adattamento chi-quadrato non fa eccezione. La distribuzione approssimata è ancora la "distribuzione Chi-quadrato" con gradi di libertà pari al numero di categorie meno uno.
In questo esercizio confronterai questi due approcci per calcolare un p-value che misura quanto la distribuzione delle prime cifre dell'Iran sia coerente con la legge di Benford. Nota che la statistica osservata che hai creato nell'esercizio precedente è salvata nel tuo spazio di lavoro come chi_obs_stat.
Questo esercizio fa parte del corso
Inferenza per dati categorici in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Compute degrees of freedom
degrees_of_freedom <- ___ %>%
# Pull out first_digit vector
pull("first_digit") %>%
# Calculate n levels and subtract 1
___
# Plot both null dists
___
# Add density layer
___
# Add vertical line at obs stat
___
# Overlay chisq approx
stat_function(fun = dchisq, args = list(df = ___), color = "blue")