Fehlende Daten visualisieren
Mit fehlenden Daten umzugehen, gehört zu den häufigsten Aufgaben in der Data Science. Es gibt verschiedene Arten von Missingness und ebenso verschiedene Strategien, damit umzugehen.
Du hast gerade eine neue Version des Data Frames accounts erhalten, der Beträge auf Konten und investierte Beträge für neue und bestehende Kundinnen und Kunden enthält. Allerdings gibt es Zeilen mit fehlenden Werten in inv_amount.
Du weißt sicher, dass die meisten Kundinnen und Kunden unter 25 noch keine Investmentkonten haben, und vermutest, dass das die fehlenden Werte beeinflusst. Die Pakete dplyr und visdat sind geladen und accounts steht zur Verfügung.
Diese Übung ist Teil des Kurses
Datenbereinigung in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Visualize the missing values by column
___