Calcolare un intervallo di confidenza

Se fornisci una singola stima di una statistica campionaria, inevitabilmente sbaglierai di qualche quantità. Per esempio, la proporzione ipotizzata di spedizioni in ritardo era del 6%. Anche se le evidenze suggeriscono che l'ipotesi nulla, secondo cui la proporzione di spedizioni in ritardo è pari a questo valore, è plausibile, per qualsiasi nuovo campione di spedizioni la proporzione sarà probabilmente un po' diversa a causa della variabilità di campionamento. Di conseguenza, è una buona idea indicare un intervallo di confidenza. In altre parole, diciamo: "siamo 'confidenti' al 95% che la proporzione di spedizioni in ritardo sia compresa tra A e B" (per alcuni valori A e B).

Il corso Sampling in Python ha mostrato due metodi per calcolare gli intervalli di confidenza. Qui userai i quantili della distribuzione bootstrap per calcolare l'intervallo di confidenza.

late_prop_samp e late_shipments_boot_distn sono disponibili; pandas e numpy sono già importati con i loro consueti alias.

Questo esercizio fa parte del corso

Test di ipotesi in Python

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Calculate 95% confidence interval using quantile method
lower = ____
upper = ____

# Print the confidence interval
print((lower, upper))

Modifica ed esegui il codice