Aan de slagGa gratis aan de slag

Hoge huur en huurlast

In plaatsen als San Francisco kunnen de huren erg hoog zijn, maar om de geografie van huurlast te begrijpen, is kijken naar bruto huren minder nuttig dan kijken naar het aandeel van het inkomen dat aan huur wordt besteed.

In deze oefening voeg je een DataFrame met bruto huren in dollars (median_rent) en als percentage van het inkomen (median_rent_pct_of_income) per Census-tract in San Francisco samen met een geopandas DataFrame van die tracts. Vervolgens maak je een kaart en vergelijk je deze twee variabelen. Donkere kleuren op de kaarten duiden hogere waarden aan (hogere huren of een hoger huuraandeel van het inkomen).

De eerste paar rijen van deze twee kolommen worden in de console weergegeven.

pandas en geopandas zijn geïmporteerd met de gebruikelijke aliassen.

Deze oefening maakt deel uit van de cursus

US Census-gegevens analyseren in Python

Cursus bekijken

Oefeninstructies

  • merge sf_rent met de sf_tracts geopandas DataFrame, waarbij je matcht op de kolommen state, county en tract.
  • Gebruik om median_rent in San Francisco in kaart te brengen de methode notnull() op de kolom median_rent om een tract met ontbrekende gegevens uit te sluiten.
  • Breng de kolom median_rent_pct_of_income in kaart. Gebruik de pijlen in het plotvenster om deze kaart te vergelijken met de kaart van median_rent.
  • Print de Pearson-correlatie tussen median_rent en median_rent_pct_of_income.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Merge geometries with rent data
sf_tracts = sf_tracts.merge(____, ____)

# Plot median rent by Census tract
sf_tracts[____].plot(column = "median_rent", cmap = "YlGnBu")
plt.show()
plt.close()

# Plot median rent as percentage of income
sf_tracts.plot(____, cmap = "YlGnBu")
plt.show()

# Show correlation between median rent and percent of income
print(sf_tracts["median_rent"].corr(____))
Code bewerken en uitvoeren