Hue en count plots
We gaan verder met het verkennen van onze gegevensset van middelbare scholieren door naar een nieuwe variabele te kijken. De kolom "school" geeft de initialen aan van de school die de leerling bezocht — "GP" of "MS".
In de vorige oefening maakten we een scatter plot waarbij de punten waren ingekleurd op basis van of de leerling in een stedelijk (urban) of landelijk (rural) gebied woonde. Hoeveel leerlingen wonen er in stedelijke versus landelijke gebieden, en verschilt dit per school? Laten we een count plot met subgroepen maken om dat uit te zoeken.
Deze oefening maakt deel uit van de cursus
Introductie tot datavisualisatie met Seaborn
Oefeninstructies
- Vul de dictionary
palette_colorsin om de"Rural"-locatiewaarde te koppelen aan de kleur"green"en de"Urban"-locatiewaarde aan de kleur"blue". - Maak een count plot met
"school"op de x-as met behulp van de DataFramestudent_data.- Voeg subgroepen toe aan de plot met de variabele
"location"en gebruik de dictionarypalette_colorsom de locatie-subgroepen groen en blauw te maken.
- Voeg subgroepen toe aan de plot met de variabele
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import Matplotlib and Seaborn
import matplotlib.pyplot as plt
import seaborn as sns
# Create a dictionary mapping subgroup values to colors
palette_colors = {____: "green", ____: "blue"}
# Create a count plot of school with location subgroups
# Display plot
plt.show()