CommencerCommencer gratuitement

Traiter les données manquantes

Dans cet exercice, vous travaillez avec une autre version des données accounts qui contient des valeurs manquantes dans les colonnes cust_id et acct_amount.

Vous souhaitez déterminer combien de clients uniques la banque possède, ainsi que le montant moyen détenu par client. Vous savez que les lignes avec un cust_id manquant ne vous aident pas vraiment et qu’en moyenne, acct_amount vaut généralement 5 fois inv_amount.

Dans cet exercice, vous allez supprimer les lignes de accounts dont le cust_id est manquant, puis imputer les valeurs manquantes de inv_amount en vous appuyant sur des connaissances métier. dplyr et assertive sont chargés et accounts est disponible.

Cet exercice fait partie du cours

Nettoyer des données avec R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create accounts_clean
accounts_clean <- accounts %>%
  # Filter to remove rows with missing cust_id
  ___

accounts_clean
Modifier et exécuter le code