Sustitución de valores ausentes
Otra forma de tratar los valores que faltan es sustituirlos todos por el mismo valor. Para las variables numéricas, una opción es sustituir los valores por 0- lo harás aquí. Sin embargo, cuando sustituyes valores ausentes, haces suposiciones sobre lo que significa un valor ausente. En este caso, supondrás que la falta de un número vendido significa que no se realizaron ventas de ese tipo de aguacate esa semana.
En este ejercicio, verás cómo la sustitución de valores ausentes puede afectar a la distribución de una variable utilizando histogramas. Puedes trazar histogramas de varias variables a la vez de la siguiente forma:
dogs[["height_cm", "weight_kg"]].hist()
pandas
se ha importado como pd
y matplotlib.pyplot
se ha importado como plt
. El conjunto de datos avocados_2016
está disponible.
Este ejercicio forma parte del curso
Manipulación de datos con pandas
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# List the columns with missing values
cols_with_missing = ["small_sold", "large_sold", "xl_sold"]
# Create histograms showing the distributions cols_with_missing
avocados_2016[____].____
# Show the plot
____