Gerar diagrama de dispersão com ausência de dados
Neste exercício, você vai criar um diagrama de dispersão contendo valores ausentes e não ausentes. Você usará a função fill_dummy_values(), criada no exercício anterior, para preencher valores fictícios no DataFrame diabetes_dummy.
A nulidade de uma coluna é calculada usando o método .isnull(). A nulidade retorna uma Series (pd.Series) de True ou False.
Para definir cores diferentes para os valores ausentes e não ausentes, você pode simplesmente combinar a nulidade usando a operação OR (|) nas colunas que está plotando, resultando em:
True\(\rightarrow\)col1oucol2ou ambos os valores estão ausentes.False\(\rightarrow\) nem os valores decol1nem decol2estão ausentes.
O DataFrame diabetes e a função fill_dummy_values() já foram carregados para você usar.
Este exercício faz parte do curso
Lidando com Dados Ausentes em Python
Instruções do exercício
- Use a operação OR para combinar a nulidade de
Skin_FoldeBMI. - Preencha valores fictícios em
diabetes_dummyusando a funçãofill_dummy_values(). - Crie um diagrama de dispersão de
'BMI'versus'Skin_Fold'; note que Y versus X implica eixo Y contra eixo X, ou Y como função de X.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Use OR operation to combine Skin_Fold and BMI nullity
nullity = ___
# Fill dummy values in diabetes_dummy
diabetes_dummy = ___
# Create a scatter plot of BMI versus Skin_Fold
diabetes_dummy.plot(x=___, y=___, kind='___', alpha=0.5,
# Set color to nullity of BMI and Skin_Fold
c=___,
cmap='rainbow')
plt.show()