Você vai excluir?
Antes de excluir valores ausentes completamente, você precisa considerar os fatores para a exclusão. O fator mais simples é o tamanho dos dados ausentes. Motivos mais complexos que afetam a ausência podem exigir conhecimento do domínio. Neste exercício, você vai identificar o motivo da ausência e então realizar a exclusão apropriada.
Primeiro, você usará msno.matrix() e msno.heatmap() para visualizar a ausência e a correlação entre variáveis com dados ausentes. Em seguida, você determinará o padrão dessa ausência. Por fim, você excluirá dependendo do tipo de ausência.
O DataFrame diabetes já foi carregado para você.
Observe que usamos uma função proprietária display() em vez de plt.show() para facilitar a visualização da saída.
Este exercício faz parte do curso
Lidando com Dados Ausentes em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Visualize the missingness in the data
___.___(___)
# Display nullity matrix
display("/usr/local/share/datasets/matrix_diabetes.png")