Assembler le tout à nouveau
Maintenant que nous comprenons mieux comment les fusions peuvent enrichir nos données, revenons à un tableau récapitulatif.
Deux DataFrames sont actuellement chargés :
transactions- La liste complète de chaque transaction de vente de billets – mais sans information sur le genre du film.movies- Un tableau avec nos titres de films et leur genre
Assemblons ces deux tables pour recréer une vue que nous tenions pour acquise auparavant : la quantité de billets vendus pour chaque genre.
Cet exercice fait partie du cours
Python pour les utilisateurs de feuilles de calcul
Instructions
- Fusionnez
transactionsavecmoviessur la colonnemovie_title. - Regroupez par
movie_genreet faites la somme. Stockez le résultat dansgenre_summary. - Triez
genre_summaryparticket_quantity. Stockez le résultat sousgenre_summary_sorted. - Affichez
genre_summary_sorted(cela a été fait pour vous).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Merge transaction data with the movie data on movie_title
transactions_with_genres = ____
# Group by movie_genre and call the sum method
genre_summary = transactions_with_genres.groupby(____, as_index=False).____()
# Sort the genre summary by ticket_quantity
genre_summary_sorted = genre_summary.____('ticket_quantity', ascending=False).reset_index(drop=True)
# View the summary
print(genre_summary_sorted)