Fortgeschrittenes Arbeiten mit fehlenden Daten
In der vorherigen Übung hast du gesehen, wie du für jede Spalte in einem DataFrame die Anzahl fehlender Werte ermittelst, und dass du anschließend einfach alle Zeilen mit fehlenden Werten entfernen kannst. Aber was, wenn es sehr viele Zeilen mit fehlenden Werten gibt? Und was, wenn du nicht einfach anfangen möchtest, Zeilen aus den Daten zu löschen? Hier kommt das Prinzip des Ersetzens ins Spiel – du kannst fehlende Werte durch etwas anderes ersetzen.
In dieser Übung arbeitest du wieder mit dem DataFrame sales_df aus der letzten Übung. Anstatt fehlende Werte zu löschen, ersetzt du die fehlenden Werte in jeder Spalte durch den Durchschnitt aller nicht fehlenden Werte. Du schreibst eine Funktion, die dann auf jede Spalte eines DataFrames angewendet werden kann.
Diese Übung ist Teil des Kurses
Julia: Aufbaukurs
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Define a function replace_missing that takes one argument, the name of the column we want to modify
____ replace_missing(____)
end