Traiter les données manquantes
Dans cet exercice, vous travaillez avec une autre version des données accounts qui contient des valeurs manquantes dans les colonnes cust_id et acct_amount.
Vous souhaitez déterminer combien de clients uniques la banque possède, ainsi que le montant moyen détenu par client. Vous savez que les lignes avec un cust_id manquant ne vous aident pas vraiment et qu’en moyenne, acct_amount vaut généralement 5 fois inv_amount.
Dans cet exercice, vous allez supprimer les lignes de accounts dont le cust_id est manquant, puis imputer les valeurs manquantes de inv_amount en vous appuyant sur des connaissances métier. dplyr et assertive sont chargés et accounts est disponible.
Cet exercice fait partie du cours
Nettoyer des données avec R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create accounts_clean
accounts_clean <- accounts %>%
# Filter to remove rows with missing cust_id
___
accounts_clean