Schaduwmatrixgegevens maken
Met missende data werken kan lastig zijn, omdat ze zich meestal niet vanzelf aankondigen en zich juist verstoppen tussen de rest van de data.
Een manier om missende waarden zichtbaar te maken is anders naar de data te kijken: door voor elke afzonderlijke datawaarde te bepalen of die ontbreekt of niet ontbreekt.
De functie as_shadow() in R zet een dataframe om naar een schaduwmatrix: een speciaal dataformaat waarin waarden óf ontbrekend zijn (NA), óf niet ontbrekend (!NA).
De kolomnamen van een schaduwmatrix zijn hetzelfde als in de data, maar met de suffix _NA erbij.
Om datawaarden te koppelen aan en te vergelijken met hun ontbrekendheidsstatus, gebruik je de functie bind_shadow(). Data in dit formaat, waarbij de schaduwmatrix aan de gewone data is vastgemaakt, heet nabular data.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in R
Oefeninstructies
Gebruik de oceanbuoys-gegevensset:
- Maak schaduwmatrixgegevens met
as_shadow() - Maak nabular data door de schaduw aan de data te binden met
bind_shadow() - Bind alleen de variabelen met missende waarden met
bind_shadow(only_miss = TRUE)
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create shadow matrix data with `as_shadow()`
___(___)
# Create nabular data by binding the shadow to the data with `bind_shadow()`
___(___)
# Bind only the variables with missing values by using bind_shadow(only_miss = TRUE)
___(___, ___ = TRUE)