Categorische gegevens in spreidingsdiagrammen
In de video bekeken we hoe de opleiding van mannen en hun huwelijkleeftijd zich verhielden tot andere variabelen in onze gegevensset, de divorce-DataFrame. Nu ga je kijken hoe de opleiding van vrouwen en hun huwelijkleeftijd zich verhouden tot andere variabelen!
Je taak is om een spreidingsdiagram te maken van de leeftijd en het inkomen van elke vrouw, waarbij je de categorische variabele opleidingsniveau toevoegt voor extra context.
De divorce-DataFrame is voor je geladen, en woman_age_marriage is al gedefinieerd als een kolom met een schatting van de leeftijd van de vrouw ten tijde van het huwelijk. pandas is geladen als pd, matplotlib.pyplot als plt, en Seaborn als sns.
Deze oefening maakt deel uit van de cursus
Exploratory Data Analysis in Python
Oefeninstructies
- Maak een spreidingsdiagram met
woman_age_marriageop de x-as enincome_womanop de y-as; elk datapunt moet een kleur krijgen op basis van het opleidingsniveau van de vrouw, weergegeven dooreducation_woman.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create the scatter plot
____
plt.show()