1. Nauka
  2. /
  3. Kursy
  4. /
  5. Sprawne importowanie danych z pandas

Connected

ćwiczenie

Łączenie ramek danych

W tym ćwiczeniu przećwiczysz łączenie rekordów – stworzysz zbiór danych 100 najwyżej ocenianych kawiarni w Nowym Jorku według serwisu Yelp.

API często ograniczają ilość zwracanych danych, ponieważ przesyłanie dużych zbiorów danych może być czasochłonne i zasobożerne. Yelp Business Search API zwraca maksymalnie 50 rekordów w jednym wywołaniu. Parametr offset pozwala jednak pobierać wyniki od wskazanego miejsca. Zmieniając wartość offsetu, możemy pobrać wyniki 1–50 w jednym wywołaniu, a 51–100 w kolejnym, a następnie połączyć obie ramki danych.

Biblioteka pandas (jako pd), requests oraz json_normalize() są już zaimportowane. 50 najwyżej ocenianych kawiarni znajduje się już w ramce danych top_50_cafes.

Instrukcje

100 XP
  • Dodaj parametr "offset" do params, tak aby wywołanie Yelp API zwróciło kawiarnie 51–100.
  • Połącz wyniki wywołania API z ramką top_50_cafes, ustawiając ignore_index tak, aby wiersze zostały przenumerowane.
  • Wyświetl kształt wynikowej ramki danych cafes, aby potwierdzić, że zawiera 100 rekordów.