Données catégorielles dans les diagrammes en nuage de points
Dans la vidéo, nous avons exploré comment le niveau de formation des hommes et l'âge au moment du mariage étaient liés à d'autres variables dans notre ensemble de données, le DataFrame divorce
. Vous allez maintenant voir comment le niveau de formation des femmes et l'âge au moment du mariage sont liés à d'autres variables.
Votre tâche consiste à créer un diagramme de en nuage de points représentant l'âge et le revenu de chaque femme, en ajoutant la variable catégorielle du niveau de formation pour un contexte supplémentaire.
Le DataFrame divorce
a été chargé pour vous et woman_age_marriage
a déjà été défini comme une colonne représentant une estimation de l'âge de la femme au moment du mariage. pandas
a été chargé en tant que pd
, matplotlib.pyplot
a été chargé en tant que plt
, et Seaborn a été chargé en tant que sns
.
Cet exercice fait partie du cours
Analyse de données exploratoires en Python
Instructions
- Créez un nuage de points représentant
woman_age_marriage
sur l'axe des x etincome_woman
sur l'axe des y ; chaque point de données doit être coloré en fonction du niveau de formation de la femme, représenté pareducation_woman
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the scatter plot
____
plt.show()