Umgang mit fehlenden Daten
In dieser Übung arbeitest du mit einer anderen Version der Daten von accounts
, die fehlende Werte für die Spalten cust_id
und acct_amount
enthält.
Du willst herausfinden, wie viele Kunden die Bank hat und wie hoch der durchschnittliche Betrag ist, den die Kunden halten. Du weißt, dass Zeilen mit fehlenden cust_id
dir nicht wirklich weiterhelfen und dass die acct_amount
im Durchschnitt das Fünffache der Menge von inv_amount
beträgt.
In dieser Übung verzichtest du auf Zeilen von accounts
mit fehlenden cust_id
s und unterstellst fehlende Werte von inv_amount
mit etwas Domänenwissen. dplyr
und assertive
sind geladen und accounts
ist verfügbar.
Diese Übung ist Teil des Kurses
Daten in R bereinigen
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create accounts_clean
accounts_clean <- accounts %>%
# Filter to remove rows with missing cust_id
___
accounts_clean