Beschrijvende statistieken
Om essentiële gezondheidsgegevens te verzamelen voor het volgen van de body mass index van jongeren, stuurden gezondheidsfunctionarissen een jongerenenquête naar een landelijk representatieve steekproef van jongeren tussen 14 en 20 jaar op 31 december 1999. De gegevensset bevat de leeftijd Age, lengte in inches Height_in, gewicht in ponden Weight_lbs, geslacht Gender, en het zelfgerapporteerde meerkeuze-antwoord op de vraag: 'Hoe zou je je gewicht omschrijven?' describe_weight.
De opgeschoonde gegevensset van de enquête is voor je ingeladen als youth_survey_clean. In deze oefening beschrijf je de gegevensset met Python.
pandas en NumPy zijn respectievelijk geladen als pd en np.
Deze oefening maakt deel uit van de cursus
Enquètegegevens analyseren in Python
Oefeninstructies
- Genereer beschrijvende statistieken voor de niet-numerieke kolommen van de enquêtegegevensset.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Generate descriptive statistics on the non-numerical columns
print(____.____(____ = ____))