ComeçarComece gratuitamente

Substituição de valores ausentes

Outra maneira de lidar com valores ausentes é substituir todos pelo mesmo valor. No caso de variáveis numéricas, uma opção é substituir os valores por 0 — você fará isso aqui. No entanto, ao substituir valores ausentes, são feitas suposições sobre o que significa um valor ausente. Nesse caso, você presume que um número de vendas ausente significa que não houve vendas daquele tipo de abacate naquela semana.

Neste exercício, você verá como a substituição de valores ausentes pode afetar a distribuição de uma variável usando histogramas. Você pode traçar histogramas com diversas variáveis ao mesmo tempo da seguinte forma:

dogs[["height_cm", "weight_kg"]].hist()

pandas foi importado como pd e matplotlib.pyplot foi importado como plt. O conjunto de dados avocados_2016 já está disponível.

Este exercício faz parte do curso

Manipulação de dados com o pandas

Ver Curso

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# List the columns with missing values
cols_with_missing = ["small_sold", "large_sold", "xl_sold"]

# Create histograms showing the distributions cols_with_missing
avocados_2016[____].____

# Show the plot
____
Editar e executar código