Die Gefahr der Mittelwertimputation erkennen
Eine der beliebtesten Imputationsmethoden ist die Mittelwertimputation: Fehlende Werte in einer Variable werden durch den Mittelwert der beobachteten Werte dieser Variable ersetzt. In vielen Fällen ist dieser einfache Ansatz jedoch eine schlechte Wahl. Manchmal reicht ein kurzer Blick auf die Daten, um auf die Risiken der Mittelwertimputation aufmerksam zu werden.
In diesem Kapitel arbeitest du mit einer Teilstichprobe der Daten des Tropical Atmosphere Ocean (tao)-Projekts. Der Datensatz besteht aus atmosphärischen Messungen, die in zwei verschiedenen Zeiträumen an fünf verschiedenen Standorten erhoben wurden. Die Daten sind im Paket VIM enthalten.
In dieser Übung machst du dich mit den Daten vertraut und führst eine einfache Analyse durch, die zeigt, welche Folgen eine Mittelwertimputation haben könnte. Lass uns die tao-Daten anschauen!
Diese Übung ist Teil des Kurses
Fehlende Daten mit Imputationen in R behandeln
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print first 10 observations
___(tao, ___)