IniziaInizia gratis

Investitori mancanti

Gestire i dati mancanti è uno dei compiti più comuni nella data science. Esistono vari tipi di mancanza, così come diverse strategie per trattare i valori mancanti.

Hai appena ricevuto una nuova versione del DataFrame banking con i dati sugli importi detenuti e investiti per clienti nuovi ed esistenti. Tuttavia, ci sono righe con valori inv_amount mancanti.

Sai per certo che la maggior parte dei clienti sotto i 25 anni non ha ancora conti di investimento e sospetti che questo possa spiegare la mancanza. I pacchetti pandas, missingno e matplotlib.pyplot sono stati importati rispettivamente come pd, msno e plt. Il DataFrame banking è nel tuo ambiente.

Questo esercizio fa parte del corso

Pulizia dei dati in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Print number of missing values in banking
print(____)

# Visualize missingness matrix
____
____
Modifica ed esegui il codice