Ontbrekende waarden vervangen
In de vorige oefening heb je de college-gegevensset geanalyseerd en vastgesteld dat '.' een ontbrekende waarde in de data voorstelt. In deze oefening leer je de beste manier om met zulke waarden om te gaan met behulp van de pandas-module.
Je leert hoe je hiermee omgaat bij het inladen van een CSV-bestand in pandas met de functie read_csv() en het aanpassen van het argument na_values, waarmee je de ontbrekende waarden van de DataFrame kunt aangeven.
De gegevensset is beschikbaar als college.csv. Zowel pandas als numpy zijn al geïmporteerd als respectievelijk pd en np.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Read the dataset 'college.csv' with na_values set to '.'
college = pd.read_csv(___, ___)
print(college.head())