1. Học hỏi
  2. /
  3. Dự An
  4. /
  5. Phân tích dữ liệu Điều tra Dân số Hoa Kỳ bằng Python

Connected

Bài tập

Tiền thuê cao và gánh nặng tiền thuê

Tiền thuê có thể rất cao ở những nơi như San Francisco, nhưng để hiểu địa lý của gánh nặng tiền thuê, nhìn vào tiền thuê gộp có thể không hữu ích bằng việc xem tỷ trọng thu nhập dành cho tiền thuê.

Trong bài tập này, bạn sẽ nối một DataFrame chứa tiền thuê gộp theo đô la (median_rent) và theo phần trăm thu nhập (median_rent_pct_of_income) theo từng Census tract ở San Francisco với một DataFrame geopandas của các tract đó. Sau đó bạn sẽ vẽ bản đồ và so sánh hai biến này. Màu đậm hơn trên bản đồ thể hiện giá trị cao hơn (tiền thuê cao hơn, hoặc tỷ trọng tiền thuê trên thu nhập cao hơn).

Vài hàng đầu tiên của hai cột này được hiển thị trong bảng điều khiển.

pandas và geopandas đã được import với các bí danh quen thuộc.

Hướng dẫn

100 XP
  • merge sf_rent với DataFrame geopandas sf_tracts, khớp theo các cột state, county và tract.
  • Để vẽ bản đồ median_rent ở San Francisco, dùng phương thức notnull() trên cột median_rent để loại một tract có dữ liệu thiếu.
  • Vẽ bản đồ cột median_rent_pct_of_income. Dùng các mũi tên trong cửa sổ vẽ để so sánh bản đồ này với bản đồ median_rent.
  • In hệ số tương quan Pearson giữa median_rent và median_rent_pct_of_income.