Hoge huur en huurlast
In plaatsen als San Francisco kunnen de huren erg hoog zijn, maar om de geografie van huurlast te begrijpen, is kijken naar bruto huren minder nuttig dan kijken naar het aandeel van het inkomen dat aan huur wordt besteed.
In deze oefening voeg je een DataFrame met bruto huren in dollars (median_rent) en als percentage van het inkomen (median_rent_pct_of_income) per Census-tract in San Francisco samen met een geopandas DataFrame van die tracts. Vervolgens maak je een kaart en vergelijk je deze twee variabelen. Donkere kleuren op de kaarten duiden hogere waarden aan (hogere huren of een hoger huuraandeel van het inkomen).
De eerste paar rijen van deze twee kolommen worden in de console weergegeven.
pandas en geopandas zijn geïmporteerd met de gebruikelijke aliassen.
Deze oefening maakt deel uit van de cursus
US Census-gegevens analyseren in Python
Oefeninstructies
mergesf_rentmet desf_tractsgeopandas DataFrame, waarbij je matcht op de kolommenstate,countyentract.- Gebruik om
median_rentin San Francisco in kaart te brengen de methodenotnull()op de kolommedian_rentom een tract met ontbrekende gegevens uit te sluiten. - Breng de kolom
median_rent_pct_of_incomein kaart. Gebruik de pijlen in het plotvenster om deze kaart te vergelijken met de kaart vanmedian_rent. - Print de Pearson-correlatie tussen
median_rentenmedian_rent_pct_of_income.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Merge geometries with rent data
sf_tracts = sf_tracts.merge(____, ____)
# Plot median rent by Census tract
sf_tracts[____].plot(column = "median_rent", cmap = "YlGnBu")
plt.show()
plt.close()
# Plot median rent as percentage of income
sf_tracts.plot(____, cmap = "YlGnBu")
plt.show()
# Show correlation between median rent and percent of income
print(sf_tracts["median_rent"].corr(____))