Investitori mancanti
Gestire i dati mancanti è uno dei compiti più comuni nella data science. Esistono vari tipi di mancanza, così come diverse strategie per trattare i valori mancanti.
Hai appena ricevuto una nuova versione del DataFrame banking con i dati sugli importi detenuti e investiti per clienti nuovi ed esistenti. Tuttavia, ci sono righe con valori inv_amount mancanti.
Sai per certo che la maggior parte dei clienti sotto i 25 anni non ha ancora conti di investimento e sospetti che questo possa spiegare la mancanza. I pacchetti pandas, missingno e matplotlib.pyplot sono stati importati rispettivamente come pd, msno e plt. Il DataFrame banking è nel tuo ambiente.
Questo esercizio fa parte del corso
Pulizia dei dati in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print number of missing values in banking
print(____)
# Visualize missingness matrix
____
____