IniziaInizia gratis

Join di più tabelle

Ora vuoi esplorare un’altra strada e mappare le posizioni dei giocatori durante i punt. Ricorderai che il sistema NextGenStats (NGS) registra posizioni e orientamenti dei giocatori 10 volte al secondo per tutti i giocatori, in ogni azione. È una mole di dati enorme!

Unirai tre data frame per preparare l’analisi. Di seguito trovi i loro nomi e le descrizioni.

  • games: dati di alto livello per GameKey
  • punts: dati a livello di azione per GameKey e PlayId
  • ngs: dati di posizione per GameKey, PlayId, GSISID (id giocatore) e Time

Un membro del tuo team ti ha fornito una list comprehension alla riga 2 per stampare l’indice di ciascun data frame con una sola riga di codice. Per maggiori informazioni sulle list comprehension, dai un’occhiata a Python Data Science Toolbox Parte 2.

Questo esercizio fa parte del corso

Join con pandas per chi usa i fogli di calcolo

Visualizza il corso

Istruzioni dell'esercizio

  • Esegui un inner join dei data frame sugli indici usando games come data frame principale.
  • Visualizza le prime 10 righe del data frame risultante.
  • Assicurati che l’indice del nuovo frame non contenga duplicati.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# List the index of each data frame
print([[n for n in df.index.names] for df in [games, punts, ngs]])

# Inner join the data frames
games_all = ____.____([punts, ____], how=____)

# View first 10 rows of new frame
print(____.head(10))

# Check index for duplicates
print(____.index.____.sum())
Modifica ed esegui il codice