Umgang mit fehlenden Daten
In dieser Übung arbeitest du mit einer anderen Version der Daten von accounts, die fehlende Werte für die Spalten cust_id und acct_amount enthält.
Du willst herausfinden, wie viele Kunden die Bank hat und wie hoch der durchschnittliche Betrag ist, den die Kunden halten. Du weißt, dass Zeilen mit fehlenden cust_id dir nicht wirklich weiterhelfen und dass die acct_amount im Durchschnitt das Fünffache der Menge von inv_amount beträgt.
In dieser Übung verzichtest du auf Zeilen von accounts mit fehlenden cust_ids und unterstellst fehlende Werte von inv_amount mit etwas Domänenwissen. dplyr und assertive sind geladen und accounts ist verfügbar.
Diese Übung ist Teil des Kurses
Daten in R bereinigen
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create accounts_clean
accounts_clean <- accounts %>%
# Filter to remove rows with missing cust_id
___
accounts_clean