Aan de slagGa gratis aan de slag

Ontbrekende waarden vervangen

In de vorige oefening heb je de college-gegevensset geanalyseerd en vastgesteld dat '.' een ontbrekende waarde in de data voorstelt. In deze oefening leer je de beste manier om met zulke waarden om te gaan met behulp van de pandas-module.

Je leert hoe je hiermee omgaat bij het inladen van een CSV-bestand in pandas met de functie read_csv() en het aanpassen van het argument na_values, waarmee je de ontbrekende waarden van de DataFrame kunt aangeven.

De gegevensset is beschikbaar als college.csv. Zowel pandas als numpy zijn al geïmporteerd als respectievelijk pd en np.

Deze oefening maakt deel uit van de cursus

Omgaan met ontbrekende gegevens in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Read the dataset 'college.csv' with na_values set to '.'
college = pd.read_csv(___, ___)
print(college.head())
Code bewerken en uitvoeren