Unir varias tablas
Ahora quieres explorar otra vía y mapear las posiciones de los jugadores durante los punts. Quizás recuerdes que el sistema NextGenStats (NGS) captura las posiciones y orientaciones de los jugadores 10 veces por segundo para todos los jugadores, en cada jugada. ¡Es una gran cantidad de datos!
Vas a unir tres data frames para prepararlos para el análisis. A continuación tienes sus nombres y descripciones.
games: datos de alto nivel por GameKeypunts: datos a nivel de jugada por GameKey y PlayIdngs: datos de posición por GameKey, PlayId, GSISID (id de jugador) y Time
Un miembro de tu equipo te ha proporcionado una comprension de listas en la línea 2 para imprimir el índice de cada data frame en una sola línea de código. Para más información sobre comprensiones de listas, consulta Python Data Science Toolbox Part 2.
Este ejercicio forma parte del curso
Uniones en pandas para usuarios de hojas de cálculo
Instrucciones del ejercicio
- Realiza un inner join de los data frames por índice usando
gamescomo data frame principal. - Muestra las primeras 10 filas del data frame resultante.
- Asegúrate de que el índice del nuevo frame no tenga duplicados.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# List the index of each data frame
print([[n for n in df.index.names] for df in [games, punts, ngs]])
# Inner join the data frames
games_all = ____.____([punts, ____], how=____)
# View first 10 rows of new frame
print(____.head(10))
# Check index for duplicates
print(____.index.____.sum())