Menggabungkan dataframe
Dalam latihan ini, Anda akan berlatih menggabungkan rekaman dengan membuat himpunan data berisi 100 kafe dengan rating tertinggi di New York City menurut Yelp.
API sering membatasi jumlah data yang dikembalikan karena pengiriman himpunan data besar memakan waktu dan sumber daya. Yelp Business Search API membatasi hasil per panggilan hingga 50 rekaman. Namun, parameter offset memungkinkan pengguna mengambil hasil mulai setelah angka tertentu. Dengan mengubah offset, kita bisa mendapatkan hasil 1–50 dalam satu panggilan dan 51–100 dalam panggilan lain. Lalu, kita dapat menambahkan dataframe tersebut.
pandas (sebagai pd), requests, dan json_normalize() telah diimpor. 50 kafe berperingkat teratas sudah ada dalam sebuah dataframe, top_50_cafes.
Latihan ini adalah bagian dari kursus
Pemasukan Data yang Efisien dengan pandas
Petunjuk latihan
- Tambahkan parameter
"offset"keparamsagar panggilan API Yelp mengambil kafe 51–100. - Gabungkan hasil panggilan API dengan
top_50_cafes, setelignore_indexagar nomor baris diurutkan ulang. - Cetak shape dari dataframe hasilnya,
cafes, untuk memastikan ada 100 rekaman.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Add an offset parameter to get cafes 51-100
params = {"term": "cafe",
"location": "NYC",
"sort_by": "rating",
"limit": 50,
____}
result = requests.get(api_url, headers=headers, params=params)
next_50_cafes = json_normalize(result.json()["businesses"])
# Concatenate the results, setting ignore_index to renumber rows
cafes = ____
# Print shape of cafes
____