Verborgen missende waarden vervangen
In de vorige twee oefeningen heb je missende waarden opgespoord en afgehandeld tijdens het importeren van een gegevensset. In deze oefening ga je verborgen missende waarden in je data herkennen en aanpakken. Je gebruikt de diabetes-gegevensset, die al voor je is ingeladen.
De diabetes DataFrame bevat 0'en in de kolom BMI. Maar BMI kan niet 0 zijn. Dit zou eigenlijk NaN moeten zijn. In deze oefening leer je zulke afwijkingen herkennen. Je voert eenvoudige data-analyse uit om missende waarden te vinden en te vervangen. Zowel numpy als pandas zijn al geïmporteerd als respectievelijk np en pd.
Daarnaast kun je wat experimenteren met de gegevensset, bijvoorbeeld door .head(), .info() enz. te printen om de gegevensset beter te leren kennen.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print the description of the data
print(___)