One-to-many-merge
Een bedrijf kan één of meerdere eigenaars hebben. In deze oefening doe je verder ervaring op met one-to-many-merges door een tabel met bedrijfseigenaars, biz_owners, te mergen met de tabel licenses. Herinner je uit de videoles: bij een one-to-many-relatie kan een rij in de linkertabel herhaald worden als die gekoppeld is aan meerdere rijen in de rechtertabel. In deze les ga je dit verder verkennen door te achterhalen wat de meest voorkomende functietitel van een eigenaar is (bijv. secretary, CEO of vice president).
De DataFrames licenses en biz_owners zijn alvast voor je ingeladen.
Deze oefening maakt deel uit van de cursus
Data samenvoegen met pandas
Oefeninstructies
- Begin met de tabel
licenseslinks, merge die met de tabelbiz_ownersop de kolomaccount, en sla de resultaten op in een variabelelicenses_owners. - Groepeer
licenses_ownersoptitleen tel het aantal accounts per titel. Sla het resultaat op alscounted_df. - Sorteer
counted_dfop het aantal accounts in aflopende volgorde, en sla dit op in een variabelesorted_df. - Gebruik de methode
.head()om de eerste paar rijen vansorted_dfte printen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Merge the licenses and biz_owners table on account
licenses_owners = ____
# Group the results by title then count the number of accounts
counted_df = licenses_owners.groupby(____).agg({'account':'count'})
# Sort the counted_df in descending order
sorted_df = counted_df.sort_values(____)
# Use .head() method to print the first few rows of sorted_df
print(____)