ComeçarComece de graça

Juntando tudo de novo

Agora que você entende melhor como junções podem enriquecer seus dados, vamos revisitar uma tabela de resumo.

Atualmente, estão carregados dois DataFrames:

  • transactions - Uma lista completa de cada transação de venda de ingressos — mas sem informações sobre o gênero do filme.
  • movies - Uma tabela com os títulos dos filmes e seus gêneros

Vamos juntar essas duas tabelas para criar uma visualização que antes a gente dava como certa: a quantidade de ingressos vendida por gênero.

Este exercício faz parte do curso

Python para usuários de planilhas

Ver curso

Instruções do exercício

  • Faça o merge de transactions com movies na coluna movie_title.
  • Agrupe por movie_genre e faça a soma. Armazene o resultado em genre_summary.
  • Ordene genre_summary por ticket_quantity. Armazene o resultado como genre_summary_sorted.
  • Imprima genre_summary_sorted (isso já foi feito para você).

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Merge transaction data with the movie data on movie_title
transactions_with_genres = ____

# Group by movie_genre and call the sum method
genre_summary = transactions_with_genres.groupby(____, as_index=False).____()

# Sort the genre summary by ticket_quantity
genre_summary_sorted = genre_summary.____('ticket_quantity', ascending=False).reset_index(drop=True)

# View the summary
print(genre_summary_sorted)
Editar e executar o código