Juntando múltiplas tabelas
Agora você quer seguir por outro caminho e mapear as posições dos jogadores durante os punts. Você deve se lembrar que o sistema NextGenStats (NGS) captura posições e orientações dos jogadores 10 vezes por segundo para todos os jogadores, em todas as jogadas. É muito dado!
Você vai juntar três data frames para preparar a análise. A seguir estão seus nomes e descrições.
games: dados de alto nível por GameKeypunts: dados em nível de jogada por GameKey e PlayIdngs: dados de posição por GameKey, PlayId, GSISID (id do jogador) e Time
Um membro do seu time forneceu uma list comprehension na linha 2 para imprimir o índice de cada data frame em uma única linha de código. Para saber mais sobre list comprehensions, confira Python Data Science Toolbox Parte 2.
Este exercício faz parte do curso
Junções no pandas para usuários de planilhas
Instruções do exercício
- Faça um inner join dos data frames pelo índice usando
gamescomo data frame principal. - Veja as primeiras 10 linhas do data frame resultante.
- Garanta que o índice do novo frame não tenha duplicatas.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# List the index of each data frame
print([[n for n in df.index.names] for df in [games, punts, ngs]])
# Inner join the data frames
games_all = ____.____([punts, ____], how=____)
# View first 10 rows of new frame
print(____.head(10))
# Check index for duplicates
print(____.index.____.sum())