Einfacher Code für komplexe Merges
Gute Nachrichten! Du hast Zugriff auf die Next Gen Stats (NGS) der Liga. NGS erfasst für jeden Spielzug die Position und Ausrichtung aller Spieler. Die Daten werden zehnmal pro Sekunde aufgezeichnet, was bedeutet, dass es allein für Punts pro Woche über 1,5 Millionen Beobachtungen gibt! Die Daten wurden bereits in einen DataFrame namens coords geladen.
Außerdem hast du allgemeine Spieldaten zu jedem Punt, die den von NGS verfolgten Punts entsprechen. Zeilen in diesem DataFrame, punts, werden durch eindeutige Kombinationen aus GameKey und PlayId identifiziert.
Um die Daten in einer Tabellenkalkulation zu verknüpfen, würdest du in jeder Tabelle eine Spalte erstellen, die GameKey und PlayId kombiniert, und die Tabellen anhand dieser neuen Spalte abgleichen. Hier kannst du mit einer einfachen merge-Anweisung punts und coords zusammenführen.
Diese Übung ist Teil des Kurses
Pandas-Joins für Spreadsheet-Nutzer
Anleitung zur Übung
- Zeige die ersten 10 Zeilen von
puntsan. Beachte, dass Zeilen für jedeGameKey-PlayId-Kombination eindeutig sind. - Zeige die ersten 10 Zeilen von
coordsan. - Führe die beiden DataFrames zusammen, mit
puntsals linkem DataFrame undcoordsals rechtem DataFrame. - Zeige die ersten 15 Zeilen des neuen DataFrames
punts_w_coordsan.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# View punts
print(____.head(10))
# View coords
print(____.head(10))
# Merge data frames
punts_w_coords = ____.merge(____)
# View new data frame
print(____.head(15))