Gestione dei dati mancanti
In questo esercizio lavori con un'altra versione dei dati accounts che contiene valori mancanti sia per le colonne cust_id che acct_amount.
Vuoi capire quanti clienti unici ha la banca e l'importo medio detenuto dai clienti. Sai che le righe con cust_id mancante non sono davvero utili e che, in media, acct_amount è di solito 5 volte l'importo di inv_amount.
In questo esercizio, eliminerai le righe di accounts con cust_id mancanti e imputerai i valori mancanti di inv_amount usando un po' di conoscenza del dominio. dplyr e assertive sono caricati e accounts è disponibile.
Questo esercizio fa parte del corso
Pulizia dei dati in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create accounts_clean
accounts_clean <- accounts %>%
# Filter to remove rows with missing cust_id
___
accounts_clean