Aan de slagGa gratis aan de slag

Ontbrekende waarden invullen met pandas

Bij het bouwen van datapijplijnen kom je onvermijdelijk ontbrekende data tegen. Soms wil je deze records uit de gegevensset verwijderen. In andere gevallen moet je waarden imputeren voor de ontbrekende informatie. In deze oefening ga je met pandas ontbrekende toetsscores imputeren.

Data uit het bestand "testing_scores.json" is ingelezen in een DataFrame en opgeslagen in de variabele raw_testing_scores. Daarnaast is pandas geïmporteerd als pd.

Deze oefening maakt deel uit van de cursus

ETL en ELT in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Print the head of the `raw_testing_scores` DataFrame
print(raw_testing_scores.____)
Code bewerken en uitvoeren