1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Streamlined Data Ingestion with pandas

Connected

cvičení

Spojení datových rámců

V předchozím cvičení jsi sestavil/a dataset 100 nejlépe hodnocených kaváren v New Yorku podle Yelpu. Teď ho zkombinuješ s demografickými daty, abys zjistil/a, která čtvrť má nejvíce dobrých kaváren na počet obyvatel.

K tomu použiješ metodu merge() pro spojení dvou datových rámců. První z nich, crosswalk, je převodník mezi PSČ a oblastmi PUMA (Public Use Micro Data Sample Areas) – agregáty sčítacích obvodů přibližně odpovídající newyorským čtvrtím. Poté přidáš data pop_data s odhadem počtu obyvatel pro každou oblast PUMA za rok 2016.

pandas (jako pd) je již importován, stejně jako datový rámec cafes z předchozího cvičení.

Pokyny 1/3

undefined XP
    1
    2
    3

Otázka

Prozkoumej datové rámce cafes a crosswalk v konzoli. Které sloupce by měly sloužit jako klíče pro spojení?

Možné odpovědi