ComeçarComece de graça

Você vai excluir?

Antes de excluir valores ausentes completamente, você precisa considerar os fatores para a exclusão. O fator mais simples é o tamanho dos dados ausentes. Motivos mais complexos que afetam a ausência podem exigir conhecimento do domínio. Neste exercício, você vai identificar o motivo da ausência e então realizar a exclusão apropriada.

Primeiro, você usará msno.matrix() e msno.heatmap() para visualizar a ausência e a correlação entre variáveis com dados ausentes. Em seguida, você determinará o padrão dessa ausência. Por fim, você excluirá dependendo do tipo de ausência.

O DataFrame diabetes já foi carregado para você.

Observe que usamos uma função proprietária display() em vez de plt.show() para facilitar a visualização da saída.

Este exercício faz parte do curso

Lidando com Dados Ausentes em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Visualize the missingness in the data
___.___(___)

# Display nullity matrix
display("/usr/local/share/datasets/matrix_diabetes.png")
Editar e executar o código