Aan de slagGa gratis aan de slag

Stapelen om trends te vinden

In de farmers-marketgegevensset ben je geïnteresseerd in het aantal maanden dat een markt open is in relatie tot de geografie, specifieker: de lengtegraad. Je bent benieuwd of er regio's in het land zijn die zich duidelijk anders gedragen dan de rest.

Om dit te onderzoeken maak je een basiskaart met een scatterplot van de breedte- en lengtegraad van elke markt, waarbij je elke markt kleurt op basis van het aantal maanden dat hij open is. Om verder in te zoomen op de relatie met de breedtegraad, teken je een regressieplot van de breedtegraad tegenover het aantal maanden open, met een flexibele trendlijn, om te bepalen of er trends zichtbaar zijn. Je wilt deze gelijktijdig bekijken om het meest heldere beeld van de trends te krijgen.

Deze oefening maakt deel uit van de cursus

Je datavisualisaties verbeteren in Python

Cursus bekijken

Oefeninstructies

  • Stel plt.subplots() zo in dat je twee plots verticaal onder elkaar krijgt.
  • Koppel de eerste (bovenste) plot aan de scatterplot van lon, lat.
  • Koppel de tweede (onderste) plot aan de regressieplot van lon naar months_open.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Setup two stacked plots
_, (ax1, ax2) = plt.subplots(____, ____)

# Draw location scatter plot on first plot
sns.scatterplot("lon", "lat", 'months_open', 
                palette = sns.light_palette("orangered",n_colors = 12), 
                legend = False, data = markets,
                ax = ____);

# Plot a regression plot on second plot
sns.regplot('lon', 'months_open',
            scatter_kws = {'alpha': 0.2, 'color': 'gray', 'marker': '|'},
            lowess = True,
            marker = '|', data = markets, 
            ax = ____)

plt.show()
Code bewerken en uitvoeren