1. Nauka
  2. /
  3. Kursy
  4. /
  5. Sprawne importowanie danych z pandas

Connected

ćwiczenie

Łączenie ramek danych

W poprzednim ćwiczeniu utworzyłeś(-aś) zbiór danych z top 100 kawiarni w Nowym Jorku według Yelp. Teraz połączysz go z danymi demograficznymi, aby sprawdzić, która dzielnica ma najwięcej dobrych kawiarni na mieszkańca.

W tym celu scalisz dwa zbiory danych za pomocą metody merge() na ramce danych. Pierwszy z nich – crosswalk – to tabela łącząca kody pocztowe z obszarami Public Use Micro Data Sample Areas (PUMA), które są grupami spisowych jednostek terytorialnych i odpowiadają mniej więcej dzielnicom Nowego Jorku. Następnie dołączysz pop_data, który zawiera szacunki liczby ludności dla każdego obszaru PUMA z 2016 roku.

pandas (jako pd) został już zaimportowany, podobnie jak ramka danych cafes z poprzedniego ćwiczenia.

Instrukcje 1/3

undefined XP
    1
    2
    3

Pytanie

Przejrzyj ramki danych cafes i crosswalk w konsoli. Które kolumny powinny pełnić rolę kluczy złączenia?

Możliwe odpowiedzi