Visualizzare i valori mancanti
Gestire i dati mancanti è uno dei compiti più comuni nella data science. Esistono diversi tipi di mancanza, così come varie strategie per affrontarla.
Hai appena ricevuto una nuova versione del data frame accounts con i dati sugli importi detenuti e investiti per clienti nuovi ed esistenti. Tuttavia, ci sono righe con valori inv_amount mancanti.
Sai per certo che la maggior parte dei clienti sotto i 25 anni non ha ancora conti di investimento e sospetti che questo possa spiegare parte della mancanza. I pacchetti dplyr e visdat sono già caricati e accounts è disponibile.
Questo esercizio fa parte del corso
Pulizia dei dati in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Visualize the missing values by column
___