Aan de slag met basistransformaties
Je bent benieuwd of de bevolking van een staat correleert met het aantal items dat op boerenmarkten wordt verkocht. Om dit te checken, neem je de log van de bevolking en maak je een spreidingsdiagram tegenover het aantal items dat per markt wordt verkocht. Uit je eerdere verkenningen van de gegevensset weet je dat er veel overlap zal zijn, dus om de patronen beter te zien wil je de doorzichtigheid van de markers verlagen.
Deze oefening maakt deel uit van de cursus
Je datavisualisaties verbeteren in Python
Oefeninstructies
- Gebruik
numpy(geïmporteerd alsnp) om een nieuwe kolomlog_popte maken door de log van de staatsbevolking te nemen. - Gebruik deze nieuw aangemaakte gelogde kolom voor de x-mapping van de scatterplotfunctie.
- Zet de doorzichtigheid van de scatterplot op 25% om overlap te laten zien.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a new logged population column
markets['____'] = np.____(markets['____'])
# Draw a scatterplot of log-population to # of items sold
sns.scatterplot(x = '____',
y = 'num_items_sold',
# Reduce point opacity to show overlap
____ = ____,
data = markets)
plt.show()