Visualização de relações entre variáveis
No último exercício, você deve ter notado que uma duração maior (marriage_duration) está correlacionada a ter mais filhos, representado pela coluna num_kids. O coeficiente de correlação entre as variáveis marriage_duration e num_kids é 0.45.
Neste exercício, você deve criar um gráfico de dispersão para visualizar a relação entre essas variáveis. pandas foi carregado como pd, matplotlib.pyplot foi carregado como plt e Seaborn foi carregado como sns. O nome do conjunto de dados é divorce.
Este exercício faz parte do curso
Análise Exploratória de Dados em Python
Instruções do exercício
- Crie um gráfico de dispersão mostrando
marriage_durationno eixo x enum_kidsno eixo y.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create the scatterplot
____
plt.show()