1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nạp dữ liệu gọn nhẹ với pandas

Connected

Bài tập

Nối (concatenate) các dataframe

Trong bài này, bạn sẽ luyện tập nối các bản ghi bằng cách tạo một tập dữ liệu về 100 quán cafe được đánh giá cao nhất ở New York City theo Yelp.

API thường giới hạn lượng dữ liệu trả về vì gửi tập dữ liệu lớn tốn thời gian và tài nguyên. Yelp Business Search API giới hạn mỗi lần gọi chỉ trả về 50 bản ghi. Tuy nhiên, tham số offset cho phép bạn lấy kết quả bắt đầu sau một số lượng chỉ định. Bằng cách thay đổi offset, ta có thể lấy kết quả 1–50 trong một lần gọi và 51–100 trong lần gọi khác. Sau đó, ta có thể nối các dataframe lại.

pandas (dưới tên pd), requests, và json_normalize() đã được import. 50 quán cafe được đánh giá cao nhất đã có sẵn trong một dataframe, top_50_cafes.

Hướng dẫn

100 XP
  • Thêm tham số "offset" vào params để lệnh gọi API của Yelp lấy các quán cafe 51–100.
  • Nối kết quả của lệnh gọi API vào top_50_cafes, đặt ignore_index để đánh số lại các hàng.
  • In kích thước (shape) của dataframe kết quả, cafes, để xác nhận có 100 bản ghi.