Shadow-Matrix-Daten erzeugen
Mit fehlenden Daten umzugehen kann knifflig sein, weil sie sich nicht von selbst zu erkennen geben, sondern sich zwischen den übrigen Werten verstecken.
Eine Möglichkeit, fehlende Werte sichtbar zu machen, ist, die Sichtweise auf die Daten zu ändern – indem du jeden einzelnen Datenwert als „fehlend“ oder „nicht fehlend“ betrachtest.
Die Funktion as_shadow() in R wandelt ein Dataframe in eine Shadow-Matrix um, ein spezielles Datenformat, in dem die Werte entweder fehlend (NA) oder nicht fehlend (!NA) sind.
Die Spaltennamen einer Shadow-Matrix sind die gleichen wie in den Daten, erhalten aber den Suffix _NA.
Um Datenwerte mit ihrem Fehlstatus zu verknüpfen und zu vergleichen, verwende die Funktion bind_shadow(). Liegen die Daten in diesem Format vor, bei dem die Shadow-Matrix an die normalen Daten angehängt ist, nennt man das nabular-Daten.
Diese Übung ist Teil des Kurses
Umgang mit fehlenden Daten in R
Anleitung zur Übung
Verwende den Datensatz oceanbuoys:
- Erzeuge Shadow-Matrix-Daten mit
as_shadow() - Erzeuge nabular-Daten, indem du die Shadow-Matrix mit
bind_shadow()an die Daten hängst - Hänge nur die Variablen mit fehlenden Werten an, indem du
bind_shadow(only_miss = TRUE)verwendest
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create shadow matrix data with `as_shadow()`
___(___)
# Create nabular data by binding the shadow to the data with `bind_shadow()`
___(___)
# Bind only the variables with missing values by using bind_shadow(only_miss = TRUE)
___(___, ___ = TRUE)