Substituição de valores ausentes
Outra maneira de lidar com valores ausentes é substituir todos pelo mesmo valor. No caso de variáveis numéricas, uma opção é substituir os valores por 0 — você fará isso aqui. No entanto, ao substituir valores ausentes, são feitas suposições sobre o que significa um valor ausente. Nesse caso, você presume que um número de vendas ausente significa que não houve vendas daquele tipo de abacate naquela semana.
Neste exercício, você verá como a substituição de valores ausentes pode afetar a distribuição de uma variável usando histogramas. Você pode traçar histogramas com diversas variáveis ao mesmo tempo da seguinte forma:
dogs[["height_cm", "weight_kg"]].hist()
pandas
foi importado como pd
e matplotlib.pyplot
foi importado como plt
. O conjunto de dados avocados_2016
já está disponível.
Este exercício faz parte do curso
Manipulação de dados com o pandas
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# List the columns with missing values
cols_with_missing = ["small_sold", "large_sold", "xl_sold"]
# Create histograms showing the distributions cols_with_missing
avocados_2016[____].____
# Show the plot
____