Aan de slagGa gratis aan de slag

Missende waarden detecteren

Gegevenssets bevatten vaak verborgen missende waarden die zijn ingevuld als bijvoorbeeld 'NA', '.' of iets anders. In deze oefening werk je met de gegevensset college, die allerlei details over studenten bevat. Je taak is om de missende waarden te identificeren door de gegevensset te analyseren.

Hiervoor kun je de methode .info() van pandas gebruiken en de numpy-functie sort() samen met de methode .unique() om duidelijk het dummyteken te onderscheiden dat de missende data voorstelt.

Het bestand college.csv is alvast voor je geladen. De pakketten numpy en pandas zijn al geïmporteerd als respectievelijk np en pd.

Deze oefening maakt deel uit van de cursus

Omgaan met ontbrekende gegevens in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Read the dataset 'college.csv'
college = ___
print(college.head())
Code bewerken en uitvoeren