IniziaInizia gratis

Gestione dei dati mancanti

In questo esercizio lavori con un'altra versione dei dati accounts che contiene valori mancanti sia per le colonne cust_id che acct_amount.

Vuoi capire quanti clienti unici ha la banca e l'importo medio detenuto dai clienti. Sai che le righe con cust_id mancante non sono davvero utili e che, in media, acct_amount è di solito 5 volte l'importo di inv_amount.

In questo esercizio, eliminerai le righe di accounts con cust_id mancanti e imputerai i valori mancanti di inv_amount usando un po' di conoscenza del dominio. dplyr e assertive sono caricati e accounts è disponibile.

Questo esercizio fa parte del corso

Pulizia dei dati in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create accounts_clean
accounts_clean <- accounts %>%
  # Filter to remove rows with missing cust_id
  ___

accounts_clean
Modifica ed esegui il codice