1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nạp dữ liệu gọn nhẹ với pandas

Connected

Bài tập

Lấy dữ liệu từ một API

Trong bài tập này, bạn sẽ dùng requests.get() để truy vấn Yelp Business Search API lấy danh sách quán cà phê ở New York City. requests.get() cần một URL để lấy dữ liệu. Yelp API cũng cần các tham số tìm kiếm và header ủy quyền được truyền lần lượt vào các đối số từ khóa params và headers.

Bạn sẽ cần trích xuất dữ liệu từ phản hồi bằng phương thức json() của nó, rồi truyền dữ liệu đó vào hàm DataFrame() của pandas để tạo một dataframe. Lưu ý dữ liệu cần thiết nằm dưới khóa dictionary "businesses".

pandas (viết tắt là pd) và requests đã được nạp. Dữ liệu ủy quyền nằm trong dictionary headers, và các tham số API cần thiết được lưu trong params.

Hướng dẫn

100 XP
  • Lấy dữ liệu về các quán cà phê ở New York City từ Yelp API (api_url) bằng requests.get(). Thông tin params và headers cần thiết đã được cung cấp.
  • Trích xuất dữ liệu JSON từ phản hồi bằng phương thức json() và gán vào data.
  • Nạp danh sách quán cà phê vào dataframe cafes bằng hàm DataFrame() của pandas. Các mục danh sách nằm dưới khóa "businesses" trong data.
  • In dtypes của dataframe để xem bạn đang nhận được những thông tin gì.