Visualizar las relaciones entre variables
En el último ejercicio, habrás observado que un marriage_duration
más largo está correlacionado con tener más hijos, representado por la columna num_kids
. El coeficiente de correlación entre las variables marriage_duration
y num_kids
es 0.45
.
En este ejercicio, crearás un gráfico de dispersión para visualizar la relación entre estas variables. pandas
se ha cargado como pd
, matplotlib.pyplot
se ha cargado como plt
, y Seaborn se ha cargado como sns
. El nombre del conjunto de datos es divorce
.
Este ejercicio forma parte del curso
Análisis exploratorio de datos en Python
Instrucciones del ejercicio
- Crea un diagrama de dispersión que muestre
marriage_duration
en el eje x ynum_kids
en el eje y.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Create the scatterplot
____
plt.show()