Alles weer samenbrengen
Nu we beter begrijpen hoe merges onze data kunnen verrijken, kijken we opnieuw naar een samenvattingstabel.
Er zijn momenteel twee DataFrames geladen:
transactions- Een volledige lijst van elke ticketverkooptransactie, maar zonder informatie over het filmgenre.movies- Een tabel met onze filmtitels en het genre
Laten we deze twee tabellen samenvoegen om een weergave te maken die we eerder als vanzelfsprekend namen: het aantal verkochte tickets per genre.
Deze oefening maakt deel uit van de cursus
Python voor spreadsheetgebruikers
Oefeninstructies
- Merge
transactionsmetmoviesop de kolommovie_title. - Groepeer op
movie_genreen tel alles op. Sla het resultaat op ingenre_summary. - Sorteer
genre_summaryopticket_quantity. Sla het resultaat op alsgenre_summary_sorted. - Print
genre_summary_sorted(dit is al voor je gedaan).
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Merge transaction data with the movie data on movie_title
transactions_with_genres = ____
# Group by movie_genre and call the sum method
genre_summary = transactions_with_genres.groupby(____, as_index=False).____()
# Sort the genre summary by ticket_quantity
genre_summary_sorted = genre_summary.____('ticket_quantity', ascending=False).reset_index(drop=True)
# View the summary
print(genre_summary_sorted)