Mehrere Tabellen verknüpfen
Du möchtest nun einen anderen Ansatz verfolgen und Spielerpositionen bei Punts abbilden. Vielleicht erinnerst du dich: Das NextGenStats-(NGS-)System erfasst 10-mal pro Sekunde die Positionen und Ausrichtungen aller Spieler bei jedem Spielzug. Das sind eine Menge Daten!
Du wirst drei DataFrames für die Analyse zusammenführen. Hier sind ihre Namen und Beschreibungen:
games: Daten auf Spielebene nach GameKeypunts: Daten auf Spielzugebene nach GameKey und PlayIdngs: Positionsdaten nach GameKey, PlayId, GSISID (Spieler-ID) und Time
Ein Teammitglied hat dir in Zeile 2 eine List Comprehension bereitgestellt, die den Index jedes DataFrames mit nur einer Codezeile ausgibt. Mehr Infos zu List Comprehensions findest du im Kurs Python Data Science Toolbox Part 2.
Diese Übung ist Teil des Kurses
Pandas-Joins für Spreadsheet-Nutzer
Anleitung zur Übung
- Führe einen Inner Join der DataFrames über den Index aus und verwende
gamesals primären DataFrame. - Zeige die ersten 10 Zeilen des resultierenden DataFrames an.
- Stelle sicher, dass der Index des neuen Frames keine Duplikate enthält.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# List the index of each data frame
print([[n for n in df.index.names] for df in [games, punts, ngs]])
# Inner join the data frames
games_all = ____.____([punts, ____], how=____)
# View first 10 rows of new frame
print(____.head(10))
# Check index for duplicates
print(____.index.____.sum())