Aan de slagGa gratis aan de slag

Populariteit van verkochte goederen per staat

De gegevensset van de boerenmarkt bevat kolommen voor 28 verschillende goederen en of die wel of niet op die markt worden verkocht. Je bent benieuwd of er interessante verhalen in deze gegevens zitten over hoe waarschijnlijk het is dat je een bepaald goed vindt op de markten van een staat. Om deze vraag te beantwoorden, heb je de data samengebracht tot drie kolommen:

  • state - de naam van de staat
  • good - het betreffende goed
  • prop_selling - het aandeel markten in die staat dat dat goed verkoopt

Om snel te zien of er patronen ontstaan, kies je een subset van goederen die je interessant vindt en maak je een eenvoudige tekst-scatter: het goed op de x-as en het aandeel markten in een staat dat dat goed verkoopt op de y-as.

Deze oefening maakt deel uit van de cursus

Je datavisualisaties verbeteren in Python

Cursus bekijken

Oefeninstructies

  • Filter goods_by_state op de gewenste goederen in to_plot.

  • Verberg de punten van de scatterplot door hun grootte op niets te zetten.

    • Let op: in sns.scatterplot() gebruik je size om waarden uit een kolom aan een grootteschaal te koppelen, en s om één vaste grootte voor alle punten in te stellen.
  • Maak de tekst midden uitgelijnd, zodat deze precies op de x-aspositie van het goed staat.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Subset goods to interesting ones
to_plot = ['Cheese','Maple','Fruits','Grains','Seafood','Plants','Vegetables']
goods_by_state_small = goods_by_state.____("good in "+str(to_plot))

g = sns.scatterplot('good','prop_selling', data = goods_by_state_small,
                    # Hide scatter points by shrinking to nothing
                    ____ = ____)

for _,row in goods_by_state_small.iterrows():
  g.annotate(row['state'], (row['good'], row['prop_selling']), 
             # Center annotation on axis
             ha = '____', 
             size = 10)

plt.show()
Code bewerken en uitvoeren