LoslegenKostenlos loslegen

Umgang mit fehlenden Daten

In dieser Übung arbeitest du mit einer anderen Version der Daten von accounts, die fehlende Werte für die Spalten cust_id und acct_amount enthält.

Du willst herausfinden, wie viele Kunden die Bank hat und wie hoch der durchschnittliche Betrag ist, den die Kunden halten. Du weißt, dass Zeilen mit fehlenden cust_id dir nicht wirklich weiterhelfen und dass die acct_amount im Durchschnitt das Fünffache der Menge von inv_amount beträgt.

In dieser Übung verzichtest du auf Zeilen von accounts mit fehlenden cust_ids und unterstellst fehlende Werte von inv_amount mit etwas Domänenwissen. dplyr und assertive sind geladen und accounts ist verfügbar.

Diese Übung ist Teil des Kurses

Daten in R bereinigen

Kurs anzeigen

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create accounts_clean
accounts_clean <- accounts %>%
  # Filter to remove rows with missing cust_id
  ___

accounts_clean
Code bearbeiten und ausführen