Populariteit van verkochte goederen per staat
De gegevensset van de boerenmarkt bevat kolommen voor 28 verschillende goederen en of die wel of niet op die markt worden verkocht. Je bent benieuwd of er interessante verhalen in deze gegevens zitten over hoe waarschijnlijk het is dat je een bepaald goed vindt op de markten van een staat. Om deze vraag te beantwoorden, heb je de data samengebracht tot drie kolommen:
state- de naam van de staatgood- het betreffende goedprop_selling- het aandeel markten in die staat dat dat goed verkoopt
Om snel te zien of er patronen ontstaan, kies je een subset van goederen die je interessant vindt en maak je een eenvoudige tekst-scatter: het goed op de x-as en het aandeel markten in een staat dat dat goed verkoopt op de y-as.
Deze oefening maakt deel uit van de cursus
Je datavisualisaties verbeteren in Python
Oefeninstructies
Filter
goods_by_stateop de gewenste goederen into_plot.Verberg de punten van de scatterplot door hun grootte op niets te zetten.
- Let op: in
sns.scatterplot()gebruik jesizeom waarden uit een kolom aan een grootteschaal te koppelen, ensom één vaste grootte voor alle punten in te stellen.
- Let op: in
Maak de tekst midden uitgelijnd, zodat deze precies op de x-aspositie van het goed staat.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Subset goods to interesting ones
to_plot = ['Cheese','Maple','Fruits','Grains','Seafood','Plants','Vegetables']
goods_by_state_small = goods_by_state.____("good in "+str(to_plot))
g = sns.scatterplot('good','prop_selling', data = goods_by_state_small,
# Hide scatter points by shrinking to nothing
____ = ____)
for _,row in goods_by_state_small.iterrows():
g.annotate(row['state'], (row['good'], row['prop_selling']),
# Center annotation on axis
ha = '____',
size = 10)
plt.show()