Calcolare un intervallo di confidenza
Se fornisci una singola stima di una statistica campionaria, inevitabilmente sbaglierai di qualche quantità. Per esempio, la proporzione ipotizzata di spedizioni in ritardo era del 6%. Anche se le evidenze suggeriscono che l'ipotesi nulla, secondo cui la proporzione di spedizioni in ritardo è pari a questo valore, è plausibile, per qualsiasi nuovo campione di spedizioni la proporzione sarà probabilmente un po' diversa a causa della variabilità di campionamento. Di conseguenza, è una buona idea indicare un intervallo di confidenza. In altre parole, diciamo: "siamo 'confidenti' al 95% che la proporzione di spedizioni in ritardo sia compresa tra A e B" (per alcuni valori A e B).
Il corso Sampling in Python ha mostrato due metodi per calcolare gli intervalli di confidenza. Qui userai i quantili della distribuzione bootstrap per calcolare l'intervallo di confidenza.
late_prop_samp e late_shipments_boot_distn sono disponibili; pandas e numpy sono già importati con i loro consueti alias.
Questo esercizio fa parte del corso
Test di ipotesi in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Calculate 95% confidence interval using quantile method
lower = ____
upper = ____
# Print the confidence interval
print((lower, upper))