Missende waarden detecteren
Gegevenssets bevatten vaak verborgen missende waarden die zijn ingevuld als bijvoorbeeld 'NA', '.' of iets anders. In deze oefening werk je met de gegevensset college, die allerlei details over studenten bevat. Je taak is om de missende waarden te identificeren door de gegevensset te analyseren.
Hiervoor kun je de methode .info() van pandas gebruiken en de numpy-functie sort() samen met de methode .unique() om duidelijk het dummyteken te onderscheiden dat de missende data voorstelt.
Het bestand college.csv is alvast voor je geladen. De pakketten numpy en pandas zijn al geïmporteerd als respectievelijk np en pd.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Read the dataset 'college.csv'
college = ___
print(college.head())