ComeçarComece de graça

Gerar diagrama de dispersão com ausência de dados

Neste exercício, você vai criar um diagrama de dispersão contendo valores ausentes e não ausentes. Você usará a função fill_dummy_values(), criada no exercício anterior, para preencher valores fictícios no DataFrame diabetes_dummy.

A nulidade de uma coluna é calculada usando o método .isnull(). A nulidade retorna uma Series (pd.Series) de True ou False.

Para definir cores diferentes para os valores ausentes e não ausentes, você pode simplesmente combinar a nulidade usando a operação OR (|) nas colunas que está plotando, resultando em:

  • True \(\rightarrow\) col1 ou col2 ou ambos os valores estão ausentes.
  • False \(\rightarrow\) nem os valores de col1 nem de col2 estão ausentes.

O DataFrame diabetes e a função fill_dummy_values() já foram carregados para você usar.

Este exercício faz parte do curso

Lidando com Dados Ausentes em Python

Ver curso

Instruções do exercício

  • Use a operação OR para combinar a nulidade de Skin_Fold e BMI.
  • Preencha valores fictícios em diabetes_dummy usando a função fill_dummy_values().
  • Crie um diagrama de dispersão de 'BMI' versus 'Skin_Fold'; note que Y versus X implica eixo Y contra eixo X, ou Y como função de X.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Use OR operation to combine Skin_Fold and BMI nullity
nullity = ___

# Fill dummy values in diabetes_dummy
diabetes_dummy = ___

# Create a scatter plot of BMI versus Skin_Fold
diabetes_dummy.plot(x=___, y=___, kind='___', alpha=0.5,                     
                    # Set color to nullity of BMI and Skin_Fold
                    c=___, 
                    cmap='rainbow')

plt.show()
Editar e executar o código