Deine erste Visualisierung fehlender Daten
Es kann schwierig sein, einen Überblick zu bekommen, wo in deinen Daten Werte fehlen – hier hilft Visualisierung besonders.
Die Funktion vis_miss() erstellt eine Übersichtsgrafik zur fehlenden Struktur im Datensatz. Sie bietet außerdem Optionen, Zeilen anhand der fehlenden Werte zu clustern (cluster = TRUE) und Spalten nach dem Anteil fehlender Werte zu sortieren – von den meisten zu den wenigsten (sort_miss = TRUE).
Diese Übung ist Teil des Kurses
Umgang mit fehlenden Daten in R
Anleitung zur Übung
Verwende den Datensatz riskfactors aus naniar:
- Nutze
vis_miss(), um die fehlenden Werte im Datensatz zu visualisieren. - Nutze
vis_miss()mitcluster = TRUE, um Cluster von fehlenden Werten zu erkunden. - Nutze
vis_miss()und sortiere die fehlenden Werte mitsort_miss, um die Spalten nach fehlenden Werten anzuordnen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Visualize all of the missingness in the `riskfactors` dataset
vis_miss(___)
# Visualize and cluster all of the missingness in the `riskfactors` dataset
vis_miss(___, ___ = TRUE)
# visualize and sort the columns by missingness in the `riskfactors` dataset
vis_miss(___, ___ = TRUE)