ComeçarComece de graça

Juntando múltiplas tabelas

Agora você quer seguir por outro caminho e mapear as posições dos jogadores durante os punts. Você deve se lembrar que o sistema NextGenStats (NGS) captura posições e orientações dos jogadores 10 vezes por segundo para todos os jogadores, em todas as jogadas. É muito dado!

Você vai juntar três data frames para preparar a análise. A seguir estão seus nomes e descrições.

  • games: dados de alto nível por GameKey
  • punts: dados em nível de jogada por GameKey e PlayId
  • ngs: dados de posição por GameKey, PlayId, GSISID (id do jogador) e Time

Um membro do seu time forneceu uma list comprehension na linha 2 para imprimir o índice de cada data frame em uma única linha de código. Para saber mais sobre list comprehensions, confira Python Data Science Toolbox Parte 2.

Este exercício faz parte do curso

Junções no pandas para usuários de planilhas

Ver curso

Instruções do exercício

  • Faça um inner join dos data frames pelo índice usando games como data frame principal.
  • Veja as primeiras 10 linhas do data frame resultante.
  • Garanta que o índice do novo frame não tenha duplicatas.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# List the index of each data frame
print([[n for n in df.index.names] for df in [games, punts, ngs]])

# Inner join the data frames
games_all = ____.____([punts, ____], how=____)

# View first 10 rows of new frame
print(____.head(10))

# Check index for duplicates
print(____.index.____.sum())
Editar e executar o código