Aan de slagGa gratis aan de slag

Onnodige kleur weghalen

Misschien wil je de relatie tussen CO en NO2-waarden per stad vergelijken met een eenvoudige scatterplot, waarbij je kleur gebruikt om de data van verschillende steden te onderscheiden.

Scatter plot of CO and NO2 with lots of overlapping plots

Helaas wordt de resulterende plot erg onoverzichtelijk. Het is lastig verschillen tussen de steden te zien, omdat je vergelijkbare kleuren van elkaar moet onderscheiden. Soms is de beste kleurenpalet voor je plot zelfs helemaal geen kleur.

Om deze moeilijk leesbare grafiek te verbeteren, haal je de kleurcomponent weg en facet je per stad. De plot is misschien minder mooi, maar wel veel geschikter om de verschillen te ontrafelen.

Deze oefening maakt deel uit van de cursus

Je datavisualisaties verbeteren in Python

Cursus bekijken

Oefeninstructies

  • Om een grafiek te maken met facetten op basis van city, geef je de plotfunctie de pollution-data mee, koppel je de stad aan de kolommen en maak je de facet drie kolommen breed.
  • Gebruik de functie g.map() om een scatterplot() over ons raster te mappen met dezelfde vormgeving als de oorspronkelijke scatter, maar zonder het hue-argument.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Hard to read scatter of CO and NO2 w/ color mapped to city
# sns.scatterplot('CO', 'NO2',
#                 alpha = 0.2,
#                 hue = 'city',
#                 data = pollution)

# Setup a facet grid to separate the cities apart
g = sns.FacetGrid(data = ____,
                  col = '____',
                  col_wrap = ____)

# Map sns.scatterplot to create separate city scatter plots
g.map(sns.____, 'CO', 'NO2', alpha = 0.2)
plt.show()
Code bewerken en uitvoeren