Een one-to-many-merge afronden
Nu het zware werk achter de rug is, is het tijd om de tabellen te mergen. Je gaat game_matchups en punts joinen. Je herinnert je misschien dat je eerder al hebt bepaald dat de dataframes er klaar voor zijn. Het enige wat rest is je geheugen opfrissen met een snelle blik en dan de code schrijven.
Na het mergen van de data kunnen we bepalen hoeveel wedstrijden een bepaald aantal punts hadden door te groeperen op GameKey en vervolgens het aantal entries in de kolom PlayId te tellen. De code is al voor je klaargezet.
Deze oefening maakt deel uit van de cursus
Pandas-joins voor spreadsheetgebruikers
Oefeninstructies
- Bekijk de eerste 5 rijen van elk dataframe.
- Voer een inner merge uit met
puntsals het rechter data frame en bekijk het resultaat
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# View first 5 rows of each data frame
print(____.head(), '\n', ____.head())
# Merge data frames
games_all = ____.merge(____, how='____')
print(____.head(10))
# Produce counts of games by number of punts
counts = games_all.groupby('GameKey')['PlayId'].size()
counts.hist()
plt.xlabel("Punts per Game")
plt.ylabel("Number of Games")
plt.show()