ComenzarEmpieza gratis

Unir varias tablas

Ahora quieres explorar otra vía y mapear las posiciones de los jugadores durante los punts. Quizás recuerdes que el sistema NextGenStats (NGS) captura las posiciones y orientaciones de los jugadores 10 veces por segundo para todos los jugadores, en cada jugada. ¡Es una gran cantidad de datos!

Vas a unir tres data frames para prepararlos para el análisis. A continuación tienes sus nombres y descripciones.

  • games: datos de alto nivel por GameKey
  • punts: datos a nivel de jugada por GameKey y PlayId
  • ngs: datos de posición por GameKey, PlayId, GSISID (id de jugador) y Time

Un miembro de tu equipo te ha proporcionado una comprension de listas en la línea 2 para imprimir el índice de cada data frame en una sola línea de código. Para más información sobre comprensiones de listas, consulta Python Data Science Toolbox Part 2.

Este ejercicio forma parte del curso

Uniones en pandas para usuarios de hojas de cálculo

Ver curso

Instrucciones del ejercicio

  • Realiza un inner join de los data frames por índice usando games como data frame principal.
  • Muestra las primeras 10 filas del data frame resultante.
  • Asegúrate de que el índice del nuevo frame no tenga duplicados.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# List the index of each data frame
print([[n for n in df.index.names] for df in [games, punts, ngs]])

# Inner join the data frames
games_all = ____.____([punts, ____], how=____)

# View first 10 rows of new frame
print(____.head(10))

# Check index for duplicates
print(____.index.____.sum())
Editar y ejecutar código