Juntando tudo de novo
Agora que você entende melhor como junções podem enriquecer seus dados, vamos revisitar uma tabela de resumo.
Atualmente, estão carregados dois DataFrames:
transactions- Uma lista completa de cada transação de venda de ingressos — mas sem informações sobre o gênero do filme.movies- Uma tabela com os títulos dos filmes e seus gêneros
Vamos juntar essas duas tabelas para criar uma visualização que antes a gente dava como certa: a quantidade de ingressos vendida por gênero.
Este exercício faz parte do curso
Python para usuários de planilhas
Instruções do exercício
- Faça o merge de
transactionscommoviesna colunamovie_title. - Agrupe por
movie_genree faça a soma. Armazene o resultado emgenre_summary. - Ordene
genre_summaryporticket_quantity. Armazene o resultado comogenre_summary_sorted. - Imprima
genre_summary_sorted(isso já foi feito para você).
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Merge transaction data with the movie data on movie_title
transactions_with_genres = ____
# Group by movie_genre and call the sum method
genre_summary = transactions_with_genres.groupby(____, as_index=False).____()
# Sort the genre summary by ticket_quantity
genre_summary_sorted = genre_summary.____('ticket_quantity', ascending=False).reset_index(drop=True)
# View the summary
print(genre_summary_sorted)