Inferentiële statistiek
Om essentiële gezondheidsgegevens te verzamelen voor het volgen van de BMI van jongeren, stuurden gezondheidsfunctionarissen een jongerenenquête uit naar een landelijk representatieve steekproef van jongeren tussen 14 en 20 jaar op 31 december 1999. De gegevensset bevat de leeftijd Age, lengte in inches Height_in, gewicht in ponden Weight_lbs, geslacht Gender, en het door de respondent zelf gerapporteerde meerkeuzeantwoord op de vraag: 'How would you describe your weight?' describe_weight.
De opgeschoonde gegevensset van de enquête is geladen als youth_survey_clean. In deze oefening ga je betrouwbaarheidsintervallen berekenen.
pandas, NumPy en SciPy’s statistiekpakket zijn geladen als respectievelijk pd, np en st.
Deze oefening maakt deel uit van de cursus
Enquètegegevens analyseren in Python
Oefeninstructies
- Bereken het betrouwbaarheidsinterval voor het werkelijke populatiegemiddelde van de lengte,
Height_in, met een betrouwbaarheidsniveau van 95%. - Bereken het betrouwbaarheidsinterval voor het werkelijke populatiegemiddelde van de lengte,
Height_in, met een betrouwbaarheidsniveau van 99%.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Find confidence interval for mean height with 95% confidence level
conf_95 = st.norm.interval(alpha = ____,
loc = np.mean(____),
scale = st.sem(____))
# Find confidence interval for mean height with 99% confidence level
conf_99 = st.norm.interval(alpha = ____,
loc = np.mean(____),
scale = st.sem(____))
print("conf_95 = ", conf_95)
print("conf_99 = ", conf_99)