Juntándolo todo de nuevo
Ahora que entiendes mejor cómo los merges pueden enriquecer tus datos, volvamos a una tabla de resumen.
Actualmente tienes cargados dos DataFrames:
transactions: una lista completa de cada transacción de venta de entradas, pero sin información sobre el género de la película.movies: una tabla con los títulos de las películas y su género.
Juntemos estas dos tablas para crear una vista que antes dábamos por hecha: la cantidad de entradas vendidas por cada género.
Este ejercicio forma parte del curso
Python para usuarios de hojas de cálculo
Instrucciones del ejercicio
- Haz un merge de
transactionsconmoviessobre la columnamovie_title. - Agrupa por
movie_genrey realiza la suma. Guarda el resultado engenre_summary. - Ordena
genre_summaryporticket_quantity. Guarda el resultado comogenre_summary_sorted. - Imprime
genre_summary_sorted(esto ya está hecho por ti).
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Merge transaction data with the movie data on movie_title
transactions_with_genres = ____
# Group by movie_genre and call the sum method
genre_summary = transactions_with_genres.groupby(____, as_index=False).____()
# Sort the genre summary by ticket_quantity
genre_summary_sorted = genre_summary.____('ticket_quantity', ascending=False).reset_index(drop=True)
# View the summary
print(genre_summary_sorted)