Visualiser les relations entre les variables
Dans le dernier exercice, vous avez peut-être remarqué qu'un mariage plus long, représenté par marriage_duration
est corrélé avec le fait d'avoir plus d'enfants (représenté par la colonne num_kids
). Le coefficient de corrélation entre les variables marriage_duration
et num_kids
est 0.45
.
Dans cet exercice, vous créerez un diagramme en nuage de points pour visualiser la relation entre ces variables. pandas
a été chargé en tant que pd
, matplotlib.pyplot
a été chargé en tant que plt
, et Seaborn a été chargé en tant que sns
. Le nom de l'ensemble de données est divorce
.
Cet exercice fait partie du cours
Analyse de données exploratoires en Python
Instructions
- Créez un nuage de points représentant
marriage_duration
sur l'axe des x etnum_kids
sur l'axe des y.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the scatterplot
____
plt.show()