CommencerCommencer gratuitement

Données catégorielles dans les diagrammes en nuage de points

Dans la vidéo, nous avons exploré comment le niveau de formation des hommes et l'âge au moment du mariage étaient liés à d'autres variables dans notre ensemble de données, le DataFrame divorce. Vous allez maintenant voir comment le niveau de formation des femmes et l'âge au moment du mariage sont liés à d'autres variables.

Votre tâche consiste à créer un diagramme de en nuage de points représentant l'âge et le revenu de chaque femme, en ajoutant la variable catégorielle du niveau de formation pour un contexte supplémentaire.

Le DataFrame divorce a été chargé pour vous et woman_age_marriage a déjà été défini comme une colonne représentant une estimation de l'âge de la femme au moment du mariage. pandas a été chargé en tant que pd, matplotlib.pyplot a été chargé en tant que plt, et Seaborn a été chargé en tant que sns.

Cet exercice fait partie du cours

Analyse de données exploratoires en Python

Afficher le cours

Instructions

  • Créez un nuage de points représentant woman_age_marriage sur l'axe des x et income_woman sur l'axe des y ; chaque point de données doit être coloré en fonction du niveau de formation de la femme, représenté par education_woman.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create the scatter plot
____
plt.show()
Modifier et exécuter le code