MulaiMulai sekarang secara gratis

Menggabungkan dataframe

Dalam latihan ini, Anda akan berlatih menggabungkan rekaman dengan membuat himpunan data berisi 100 kafe dengan rating tertinggi di New York City menurut Yelp.

API sering membatasi jumlah data yang dikembalikan karena pengiriman himpunan data besar memakan waktu dan sumber daya. Yelp Business Search API membatasi hasil per panggilan hingga 50 rekaman. Namun, parameter offset memungkinkan pengguna mengambil hasil mulai setelah angka tertentu. Dengan mengubah offset, kita bisa mendapatkan hasil 1–50 dalam satu panggilan dan 51–100 dalam panggilan lain. Lalu, kita dapat menambahkan dataframe tersebut.

pandas (sebagai pd), requests, dan json_normalize() telah diimpor. 50 kafe berperingkat teratas sudah ada dalam sebuah dataframe, top_50_cafes.

Latihan ini adalah bagian dari kursus

Pemasukan Data yang Efisien dengan pandas

Lihat Kursus

Petunjuk latihan

  • Tambahkan parameter "offset" ke params agar panggilan API Yelp mengambil kafe 51–100.
  • Gabungkan hasil panggilan API dengan top_50_cafes, setel ignore_index agar nomor baris diurutkan ulang.
  • Cetak shape dari dataframe hasilnya, cafes, untuk memastikan ada 100 rekaman.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Add an offset parameter to get cafes 51-100
params = {"term": "cafe", 
          "location": "NYC",
          "sort_by": "rating", 
          "limit": 50,
          ____}

result = requests.get(api_url, headers=headers, params=params)
next_50_cafes = json_normalize(result.json()["businesses"])

# Concatenate the results, setting ignore_index to renumber rows
cafes = ____

# Print shape of cafes
____
Edit dan Jalankan Kode