Aan de slagGa gratis aan de slag

Hue en count plots

We gaan verder met het verkennen van onze gegevensset van middelbare scholieren door naar een nieuwe variabele te kijken. De kolom "school" geeft de initialen aan van de school die de leerling bezocht — "GP" of "MS".

In de vorige oefening maakten we een scatter plot waarbij de punten waren ingekleurd op basis van of de leerling in een stedelijk (urban) of landelijk (rural) gebied woonde. Hoeveel leerlingen wonen er in stedelijke versus landelijke gebieden, en verschilt dit per school? Laten we een count plot met subgroepen maken om dat uit te zoeken.

Deze oefening maakt deel uit van de cursus

Introductie tot datavisualisatie met Seaborn

Cursus bekijken

Oefeninstructies

  • Vul de dictionary palette_colors in om de "Rural"-locatiewaarde te koppelen aan de kleur "green" en de "Urban"-locatiewaarde aan de kleur "blue".
  • Maak een count plot met "school" op de x-as met behulp van de DataFrame student_data.
    • Voeg subgroepen toe aan de plot met de variabele "location" en gebruik de dictionary palette_colors om de locatie-subgroepen groen en blauw te maken.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import Matplotlib and Seaborn
import matplotlib.pyplot as plt
import seaborn as sns

# Create a dictionary mapping subgroup values to colors
palette_colors = {____: "green", ____: "blue"}

# Create a count plot of school with location subgroups




# Display plot
plt.show()
Code bewerken en uitvoeren