LoslegenKostenlos starten

Inferenzstatistik

Um wichtige Gesundheitsdaten zur Verfolgung des Body-Mass-Index von Jugendlichen zu erhalten, haben Gesundheitsbehörden eine Jugendbefragung an eine national repräsentative Stichprobe von 14- bis 20-Jährigen (Stichtag 31. Dezember 1999) verschickt. Der Datensatz erfasst das Alter Age, die Körpergröße in Zoll Height_in, das Gewicht in Pfund Weight_lbs, das Geschlecht Gender sowie die selbst berichtete Multiple-Choice-Antwort auf die Frage: "How would you describe your weight?" describe_weight.

Der bereinigte Datensatz der Befragung wurde als youth_survey_clean geladen. In dieser Übung berechnest du Konfidenzintervalle.

pandas, NumPy und das Statistikpaket von SciPy sind als pd, np bzw. st geladen.

Diese Übung ist Teil des Kurses

<Kurs>Umfragedaten in Python analysieren</Kurs>
Kurs ansehen

Übungsanweisungen

  • Berechne das Konfidenzintervall für den wahren Populationsmittelwert der Körpergröße Height_in mit einem Konfidenzniveau von 95 %.
  • Berechne das Konfidenzintervall für den wahren Populationsmittelwert der Körpergröße Height_in mit einem Konfidenzniveau von 99 %.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Find confidence interval for mean height with 95% confidence level
conf_95 = st.norm.interval(alpha = ____, 
                           loc = np.mean(____), 
                           scale = st.sem(____))

# Find confidence interval for mean height with 99% confidence level
conf_99 = st.norm.interval(alpha = ____, 
                           loc = np.mean(____), 
                           scale = st.sem(____))
print("conf_95 = ", conf_95)
print("conf_99 = ", conf_99)
Code bearbeiten und ausführen