1. Nauka
  2. /
  3. Kursy
  4. /
  5. Pandas Joins dla użytkowników arkuszy kalkulacyjnych

Connected

ćwiczenie

Proste łączenie złożonych danych

Dobra wiadomość! Masz dostęp do danych Next Gen Stats (NGS) ligi. NGS rejestruje pozycję i orientację każdego zawodnika podczas każdej akcji. Dane są zapisywane 10 razy na sekundę – oznacza to ponad 1,5 miliona obserwacji tygodniowo tylko dla kopów! Dane zostały już wczytane do ramki danych o nazwie coords.

Masz też ogólne dane o każdym kopie, odpowiadające akcjom śledzonym przez NGS. Wiersze w tej ramce danych, o nazwie punts, są identyfikowane przez unikalne kombinacje wartości GameKey i PlayId.

Łącząc dane w arkuszu kalkulacyjnym, musiałbyś(-abyś) w każdej tabeli utworzyć kolumnę łączącą GameKey i PlayId, a następnie dopasować tabele na podstawie tej nowej kolumny. Tutaj możesz wypróbować proste wyrażenie merge, aby połączyć punts i coords.

Instrukcje

100 XP
  • Wyświetl pierwsze 10 wierszy ramki danych punts. Zwróć uwagę, że wiersze są unikalne dla każdej kombinacji GameKey-PlayId.
  • Wyświetl pierwsze 10 wierszy ramki danych coords.
  • Scal obie ramki danych, przyjmując punts jako lewą ramkę danych, a coords jako prawą ramkę danych.
  • Wyświetl pierwsze 15 wierszy nowej ramki danych punts_w_coords.