1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nạp dữ liệu gọn nhẹ với pandas

Connected

Bài tập

Gộp các dataframe

Trong bài tập trước, bạn đã xây dựng một tập dữ liệu gồm 100 quán cà phê hàng đầu ở New York City theo Yelp. Giờ đây, bạn sẽ kết hợp tập này với dữ liệu nhân khẩu học để tìm xem khu nào có nhiều quán cà phê tốt trên đầu người nhất.

Để làm điều đó, bạn sẽ gộp hai tập dữ liệu bằng phương thức merge() của DataFrame. Tập thứ nhất, crosswalk, là bảng đối chiếu giữa mã ZIP và các vùng Public Use Micro Data Sample Areas (PUMA) — là tổng hợp của các lô dân số (census tracts) và xấp xỉ các khu phố ở NYC. Sau đó, bạn sẽ gộp thêm pop_data, chứa ước tính dân số năm 2016 cho từng PUMA.

pandas (viết tắt pd) đã được nhập, cùng với dataframe cafes từ bài trước.

Hướng dẫn 1/3

undefined XP
    1
    2
    3

Câu hỏi

Khám phá các dataframe cafes và crosswalk trong console. Nên dùng những cột nào làm khóa nối?

Các phương án trả lời