Ontbrekende waarden invullen met pandas
Bij het bouwen van datapijplijnen kom je onvermijdelijk ontbrekende data tegen. Soms wil je deze records uit de gegevensset verwijderen. In andere gevallen moet je waarden imputeren voor de ontbrekende informatie. In deze oefening ga je met pandas ontbrekende toetsscores imputeren.
Data uit het bestand "testing_scores.json" is ingelezen in een DataFrame en opgeslagen in de variabele raw_testing_scores. Daarnaast is pandas geïmporteerd als pd.
Deze oefening maakt deel uit van de cursus
ETL en ELT in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print the head of the `raw_testing_scores` DataFrame
print(raw_testing_scores.____)