Sostituzione dei valori mancanti
Un altro modo per gestire i valori mancanti è sostituirli tutti con lo stesso valore. Per le variabili numeriche, una possibilità è sostituirli con 0: ed è quello che farai in questo esercizio. Tieni presente che sostituire i valori mancanti significa fare delle ipotesi sul loro significato. In questo caso, dovrai assumere che un valore mancante indichi che non ci sono state vendite di quel tipo di avocado in quella settimana.
In questo esercizio vedrai come la sostituzione dei valori mancanti può influire sulla distribuzione di una variabile, utilizzando gli istogrammi. Puoi tracciare istogrammi per più variabili contemporaneamente come segue:
dogs[["height_cm", "weight_kg"]].hist()
pandas
è già stato importato come pd
e matplotlib.pyplot
è già stato importato come plt
. Il set di dati avocados_2016
è a tua disposizione.
Questo esercizio fa parte del corso
Manipolazione dei dati con pandas
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# List the columns with missing values
cols_with_missing = ["small_sold", "large_sold", "xl_sold"]
# Create histograms showing the distributions cols_with_missing
avocados_2016[____].____
# Show the plot
____