Statistica inferenziale
Per raccogliere dati sanitari fondamentali sul monitoraggio dell'indice di massa corporea dei giovani, i responsabili della sanità hanno inviato un sondaggio a un campione rappresentativo a livello nazionale di ragazzi tra i 14 e i 20 anni al 31 dicembre 1999. Il set di dati tiene traccia dell'età Age, dell'altezza in pollici Height_in, del peso in libbre Weight_lbs, del genere Gender e della risposta a scelta multipla auto-dichiarata alla domanda: "Come descriveresti il tuo peso?" describe_weight.
Il set di dati ripulito del sondaggio è stato caricato come youth_survey_clean. In questo esercizio calcolerai gli intervalli di confidenza.
pandas, NumPy e il pacchetto di statistiche di SciPy sono stati caricati rispettivamente come pd, np e st.
Questo esercizio fa parte del corso
Analisi dei dati da sondaggio in Python
Istruzioni dell'esercizio
- Calcola l'intervallo di confidenza per la vera media della popolazione dell'altezza,
Height_in, usando un livello di confidenza del 95%. - Calcola l'intervallo di confidenza per la vera media della popolazione dell'altezza,
Height_in, usando un livello di confidenza del 99%.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Find confidence interval for mean height with 95% confidence level
conf_95 = st.norm.interval(alpha = ____,
loc = np.mean(____),
scale = st.sem(____))
# Find confidence interval for mean height with 99% confidence level
conf_99 = st.norm.interval(alpha = ____,
loc = np.mean(____),
scale = st.sem(____))
print("conf_95 = ", conf_95)
print("conf_99 = ", conf_99)