LoslegenKostenlos loslegen

Mehrere Tabellen verknüpfen

Du möchtest nun einen anderen Ansatz verfolgen und Spielerpositionen bei Punts abbilden. Vielleicht erinnerst du dich: Das NextGenStats-(NGS-)System erfasst 10-mal pro Sekunde die Positionen und Ausrichtungen aller Spieler bei jedem Spielzug. Das sind eine Menge Daten!

Du wirst drei DataFrames für die Analyse zusammenführen. Hier sind ihre Namen und Beschreibungen:

  • games: Daten auf Spielebene nach GameKey
  • punts: Daten auf Spielzugebene nach GameKey und PlayId
  • ngs: Positionsdaten nach GameKey, PlayId, GSISID (Spieler-ID) und Time

Ein Teammitglied hat dir in Zeile 2 eine List Comprehension bereitgestellt, die den Index jedes DataFrames mit nur einer Codezeile ausgibt. Mehr Infos zu List Comprehensions findest du im Kurs Python Data Science Toolbox Part 2.

Diese Übung ist Teil des Kurses

Pandas-Joins für Spreadsheet-Nutzer

Kurs anzeigen

Anleitung zur Übung

  • Führe einen Inner Join der DataFrames über den Index aus und verwende games als primären DataFrame.
  • Zeige die ersten 10 Zeilen des resultierenden DataFrames an.
  • Stelle sicher, dass der Index des neuen Frames keine Duplikate enthält.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# List the index of each data frame
print([[n for n in df.index.names] for df in [games, punts, ngs]])

# Inner join the data frames
games_all = ____.____([punts, ____], how=____)

# View first 10 rows of new frame
print(____.head(10))

# Check index for duplicates
print(____.index.____.sum())
Code bearbeiten und ausführen