Aan de slagGa gratis aan de slag

Aan de slag met basistransformaties

Je bent benieuwd of de bevolking van een staat correleert met het aantal items dat op boerenmarkten wordt verkocht. Om dit te checken, neem je de log van de bevolking en maak je een spreidingsdiagram tegenover het aantal items dat per markt wordt verkocht. Uit je eerdere verkenningen van de gegevensset weet je dat er veel overlap zal zijn, dus om de patronen beter te zien wil je de doorzichtigheid van de markers verlagen.

Deze oefening maakt deel uit van de cursus

Je datavisualisaties verbeteren in Python

Cursus bekijken

Oefeninstructies

  • Gebruik numpy (geïmporteerd als np) om een nieuwe kolom log_pop te maken door de log van de staatsbevolking te nemen.
  • Gebruik deze nieuw aangemaakte gelogde kolom voor de x-mapping van de scatterplotfunctie.
  • Zet de doorzichtigheid van de scatterplot op 25% om overlap te laten zien.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a new logged population column 
markets['____'] = np.____(markets['____'])

# Draw a scatterplot of log-population to # of items sold
sns.scatterplot(x = '____', 
                  y = 'num_items_sold', 
                  # Reduce point opacity to show overlap
                  ____ = ____, 
                  data = markets)

plt.show()
Code bewerken en uitvoeren