Visualização de relações entre variáveis
No último exercício, você deve ter notado que uma duração maior (marriage_duration
) está correlacionada a ter mais filhos, representado pela coluna num_kids
. O coeficiente de correlação entre as variáveis marriage_duration
e num_kids
é 0.45
.
Neste exercício, você deve criar um gráfico de dispersão para visualizar a relação entre essas variáveis. pandas
foi carregado como pd
, matplotlib.pyplot
foi carregado como plt
e Seaborn foi carregado como sns
. O nome do conjunto de dados é divorce
.
Este exercício faz parte do curso
Análise Exploratória de Dados em Python
Instruções de exercício
- Crie um gráfico de dispersão mostrando
marriage_duration
no eixo x enum_kids
no eixo y.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create the scatterplot
____
plt.show()