Aan de slagGa gratis aan de slag

Geavanceerde ontbrekende data

In de vorige oefening heb je gezien hoe je kunt bepalen hoeveel ontbrekende waarden er in elke kolom van een DataFrame staan, en hoe je vervolgens alle rijen met ontbrekende waarden kunt verwijderen. Maar wat als er heel veel rijen met ontbrekende waarden zijn? Of als je niet zomaar rijen uit de data wilt schrappen? Dan komt het idee van vervangen om de hoek kijken: je kunt de ontbrekende waarden vervangen door iets anders.

In deze oefening werk je met dezelfde DataFrame sales_df als in de vorige oefening, maar in plaats van ontbrekende waarden te verwijderen, vervang je de ontbrekende waarden in elke kolom door het gemiddelde van alle niet-ontbrekende waarden. Je schrijft een functie die je daarna op elke kolom in een DataFrame kunt toepassen.

Deze oefening maakt deel uit van de cursus

Julia voor gevorderden

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Define a function replace_missing that takes one argument, the name of the column we want to modify
____ replace_missing(____)
end
Code bewerken en uitvoeren