1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Pandas Joins pro uživatele tabulkových procesorů

Connected

cvičení

Jednoduché sloučení složitých dat

Skvělá zpráva! Máš přístup k datům Next Gen Stats (NGS) ligy. NGS zachycuje polohu a orientaci každého hráče při každé akci. Data se zaznamenávají 10krát za sekundu – to znamená více než 1,5 milionu záznamů týdně jen pro punty! Data jsou již načtená v datovém rámci coords.

Máš také obecná herní data o každém puntu, která odpovídají puntům sledovaným pomocí NGS. Řádky v tomto datovém rámci, nazvaném punts, jsou jednoznačně identifikovány kombinací hodnot GameKey a PlayId.

V tabulkovém prostředí bys pro spojení dat vytvořil/a v každé tabulce sloupec kombinující GameKey a PlayId a tabulky propojil/a podle tohoto nového sloupce. Tady si můžeš vyzkoušet jednoduchý příkaz merge pro spojení punts a coords.

Pokyny

100 XP
  • Zobraz prvních 10 řádků datového rámce punts. Všimni si, že každý řádek odpovídá jedinečné kombinaci GameKey a PlayId.
  • Zobraz prvních 10 řádků datového rámce coords.
  • Spoj oba datové rámce tak, aby punts byl levý datový rámec a coords pravý datový rámec.
  • Zobraz prvních 15 řádků nového datového rámce punts_w_coords.