Inferenzstatistik
Um wichtige Gesundheitsdaten zur Verfolgung des Body-Mass-Index von Jugendlichen zu erhalten, haben Gesundheitsbehörden eine Jugendbefragung an eine national repräsentative Stichprobe von 14- bis 20-Jährigen (Stichtag 31. Dezember 1999) verschickt. Der Datensatz erfasst das Alter Age, die Körpergröße in Zoll Height_in, das Gewicht in Pfund Weight_lbs, das Geschlecht Gender sowie die selbst berichtete Multiple-Choice-Antwort auf die Frage: "How would you describe your weight?" describe_weight.
Der bereinigte Datensatz der Befragung wurde als youth_survey_clean geladen. In dieser Übung berechnest du Konfidenzintervalle.
pandas, NumPy und das Statistikpaket von SciPy sind als pd, np bzw. st geladen.
Diese Übung ist Teil des Kurses
<Kurs>Umfragedaten in Python analysieren</Kurs>Übungsanweisungen
- Berechne das Konfidenzintervall für den wahren Populationsmittelwert der Körpergröße
Height_inmit einem Konfidenzniveau von 95 %. - Berechne das Konfidenzintervall für den wahren Populationsmittelwert der Körpergröße
Height_inmit einem Konfidenzniveau von 99 %.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Find confidence interval for mean height with 95% confidence level
conf_95 = st.norm.interval(alpha = ____,
loc = np.mean(____),
scale = st.sem(____))
# Find confidence interval for mean height with 99% confidence level
conf_99 = st.norm.interval(alpha = ____,
loc = np.mean(____),
scale = st.sem(____))
print("conf_95 = ", conf_95)
print("conf_99 = ", conf_99)