CommencerCommencer gratuitement

Assembler le tout à nouveau

Maintenant que nous comprenons mieux comment les fusions peuvent enrichir nos données, revenons à un tableau récapitulatif.

Deux DataFrames sont actuellement chargés :

  • transactions - La liste complète de chaque transaction de vente de billets – mais sans information sur le genre du film.
  • movies - Un tableau avec nos titres de films et leur genre

Assemblons ces deux tables pour recréer une vue que nous tenions pour acquise auparavant : la quantité de billets vendus pour chaque genre.

Cet exercice fait partie du cours

Python pour les utilisateurs de feuilles de calcul

Afficher le cours

Instructions

  • Fusionnez transactions avec movies sur la colonne movie_title.
  • Regroupez par movie_genre et faites la somme. Stockez le résultat dans genre_summary.
  • Triez genre_summary par ticket_quantity. Stockez le résultat sous genre_summary_sorted.
  • Affichez genre_summary_sorted (cela a été fait pour vous).

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Merge transaction data with the movie data on movie_title
transactions_with_genres = ____

# Group by movie_genre and call the sum method
genre_summary = transactions_with_genres.groupby(____, as_index=False).____()

# Sort the genre summary by ticket_quantity
genre_summary_sorted = genre_summary.____('ticket_quantity', ascending=False).reset_index(drop=True)

# View the summary
print(genre_summary_sorted)
Modifier et exécuter le code