1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Pandas Joins pro uživatele tabulkových procesorů

Connected

cvičení

Spojování více tabulek

Teď se chceš vydat jiným směrem a sledovat pozice hráčů při puntech. Možná si pamatuješ, že systém NextGenStats (NGS) zaznamenává pozice a orientaci hráčů desetkrát za sekundu – pro všechny hráče, při každé akci. Je to opravdu hodně dat!

Pro přípravu analýzy budeš spojovat tři datové rámce. Tady jsou jejich názvy a popisy.

  • games: souhrnná data podle GameKey
  • punts: data na úrovni akcí podle GameKey a PlayId
  • ngs: polohová data podle GameKey, PlayId, GSISID (id hráče) a Time

Člen tvého týmu ti na řádku 2 připravil list comprehension, který vypíše index každého datového rámce na jednom řádku kódu. Více informací o list comprehensions najdeš v kurzu Python Data Science Toolbox Part 2.

Pokyny

100 XP
  • Spoj datové rámce na základě indexu pomocí inner join – jako primární datový rámec použij games.
  • Zobraz prvních 10 řádků výsledného datového rámce.
  • Ověř, že index nového rámce neobsahuje žádné duplicity.