Join di più tabelle
Ora vuoi esplorare un’altra strada e mappare le posizioni dei giocatori durante i punt. Ricorderai che il sistema NextGenStats (NGS) registra posizioni e orientamenti dei giocatori 10 volte al secondo per tutti i giocatori, in ogni azione. È una mole di dati enorme!
Unirai tre data frame per preparare l’analisi. Di seguito trovi i loro nomi e le descrizioni.
games: dati di alto livello per GameKeypunts: dati a livello di azione per GameKey e PlayIdngs: dati di posizione per GameKey, PlayId, GSISID (id giocatore) e Time
Un membro del tuo team ti ha fornito una list comprehension alla riga 2 per stampare l’indice di ciascun data frame con una sola riga di codice. Per maggiori informazioni sulle list comprehension, dai un’occhiata a Python Data Science Toolbox Parte 2.
Questo esercizio fa parte del corso
Join con pandas per chi usa i fogli di calcolo
Istruzioni dell'esercizio
- Esegui un inner join dei data frame sugli indici usando
gamescome data frame principale. - Visualizza le prime 10 righe del data frame risultante.
- Assicurati che l’indice del nuovo frame non contenga duplicati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# List the index of each data frame
print([[n for n in df.index.names] for df in [games, punts, ngs]])
# Inner join the data frames
games_all = ____.____([punts, ____], how=____)
# View first 10 rows of new frame
print(____.head(10))
# Check index for duplicates
print(____.index.____.sum())