Aan de slagGa gratis aan de slag

Ontbrekende waarden vervangen

Een andere manier om met ontbrekende waarden om te gaan, is ze allemaal door dezelfde waarde te vervangen. Voor numerieke variabelen kun je bijvoorbeeld alles vervangen door 0; dat ga je hier doen. Bedenk wel dat je bij het vervangen van ontbrekende waarden aannames maakt over wat een ontbrekende waarde betekent. In dit geval neem je aan dat een ontbrekend aantal verkochte avocado's betekent dat er die week geen verkopen zijn geweest voor dat type avocado.

In deze oefening zie je met histogrammen hoe het vervangen van ontbrekende waarden de verdeling van een variabele kan beïnvloeden. Je kunt histogrammen voor meerdere variabelen tegelijk tekenen als volgt:

dogs[["height_cm", "weight_kg"]].hist()

pandas is geïmporteerd als pd en matplotlib.pyplot is geïmporteerd als plt. De dataset avocados_2016 is beschikbaar.

Deze oefening maakt deel uit van de cursus

Datamanipulatie met pandas

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# List the columns with missing values
cols_with_missing = ["small_sold", "large_sold", "xl_sold"]

# Create histograms showing the distributions cols_with_missing
avocados_2016[____].____

# Show the plot
____
Code bewerken en uitvoeren