Visualisierung fehlender Daten
Der Umgang mit fehlenden Daten ist eine der häufigsten Aufgaben in der Datenwissenschaft. Es gibt eine Vielzahl von Arten von fehlenden Daten und eine Vielzahl von Lösungen für fehlende Daten.
Du hast soeben eine neue Version des accounts
Datenrahmens erhalten, der Daten über den gehaltenen Betrag und den investierten Betrag für neue und bestehende Kunden enthält. Es gibt jedoch Zeilen mit fehlenden inv_amount
Werten.
Du weißt mit Sicherheit, dass die meisten Kunden unter 25 Jahren noch kein Anlagekonto haben, und vermutest, dass dies der Grund für die fehlende Anzahl an Kunden sein könnte. Die Pakete dplyr
und visdat
wurden geladen und accounts
ist verfügbar.
Diese Übung ist Teil des Kurses
Daten in R bereinigen
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Visualize the missing values by column
___