LoslegenKostenlos loslegen

Deine erste Visualisierung fehlender Daten

Es kann schwierig sein, einen Überblick zu bekommen, wo in deinen Daten Werte fehlen – hier hilft Visualisierung besonders.

Die Funktion vis_miss() erstellt eine Übersichtsgrafik zur fehlenden Struktur im Datensatz. Sie bietet außerdem Optionen, Zeilen anhand der fehlenden Werte zu clustern (cluster = TRUE) und Spalten nach dem Anteil fehlender Werte zu sortieren – von den meisten zu den wenigsten (sort_miss = TRUE).

Diese Übung ist Teil des Kurses

Umgang mit fehlenden Daten in R

Kurs anzeigen

Anleitung zur Übung

Verwende den Datensatz riskfactors aus naniar:

  • Nutze vis_miss(), um die fehlenden Werte im Datensatz zu visualisieren.
  • Nutze vis_miss() mit cluster = TRUE, um Cluster von fehlenden Werten zu erkunden.
  • Nutze vis_miss() und sortiere die fehlenden Werte mit sort_miss, um die Spalten nach fehlenden Werten anzuordnen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Visualize all of the missingness in the `riskfactors`  dataset
vis_miss(___)

# Visualize and cluster all of the missingness in the `riskfactors` dataset
vis_miss(___, ___ = TRUE)

# visualize and sort the columns by missingness in the `riskfactors` dataset
vis_miss(___, ___ = TRUE)
Code bearbeiten und ausführen