Missende waarden detecteren

Gegevenssets bevatten vaak verborgen missende waarden die zijn ingevuld als bijvoorbeeld 'NA', '.' of iets anders. In deze oefening werk je met de gegevensset college, die allerlei details over studenten bevat. Je taak is om de missende waarden te identificeren door de gegevensset te analyseren.

Hiervoor kun je de methode .info() van pandas gebruiken en de numpy-functie sort() samen met de methode .unique() om duidelijk het dummyteken te onderscheiden dat de missende data voorstelt.

Het bestand college.csv is alvast voor je geladen. De pakketten numpy en pandas zijn al geïmporteerd als respectievelijk np en pd.

Deze oefening maakt deel uit van de cursus

Omgaan met ontbrekende gegevens in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Read the dataset 'college.csv'
college = ___
print(college.head())

Code bewerken en uitvoeren