1. Nauka
  2. /
  3. Kursy
  4. /
  5. Pandas Joins dla użytkowników arkuszy kalkulacyjnych

Connected

ćwiczenie

Łączenie wielu tabel

Tym razem chcesz przeanalizować pozycje zawodników podczas zagrań karcących (punts). System NextGenStats (NGS) rejestruje pozycje i orientacje wszystkich zawodników 10 razy na sekundę, w każdej akcji. To naprawdę duże ilości danych!

Połączysz trzy ramki danych, aby przygotować się do analizy. Poniżej znajdziesz ich nazwy i opisy.

  • games: dane ogólne według klucza GameKey
  • punts: dane na poziomie akcji według GameKey i PlayId
  • ngs: dane o pozycjach według GameKey, PlayId, GSISID (identyfikator zawodnika) i Time

Kolega z zespołu przygotował dla ciebie wyrażenie listowe w wierszu 2, które wypisuje indeks każdej ramki danych w jednej linii kodu. Jeśli chcesz dowiedzieć się więcej o wyrażeniach listowych, zajrzyj do kursu Python Data Science Toolbox Part 2.

Instrukcje

100 XP
  • Wykonaj złączenie wewnętrzne (inner join) ramek danych po indeksie, używając games jako głównej ramki danych.
  • Wyświetl pierwsze 10 wierszy wynikowej ramki danych.
  • Sprawdź, czy indeks nowej ramki nie zawiera duplikatów.