Fusion de un-à-plusieurs
Une entreprise peut avoir un ou plusieurs propriétaires. Dans cet exercice, vous allez continuer à acquérir de l'expérience avec les fusions un-à-plusieurs en fusionnant une table de propriétaires d'entreprises, appelée biz_owners
, avec la table licenses
. Rappelez-vous de la leçon vidéo : dans le cas d'une relation de type « un-à-plusieurs », une ligne de la table de gauche peut être répétée si elle est liée à plusieurs lignes de la table de droite. Dans cette leçon, vous approfondirez cette question en découvrant quel est le titre le plus courant des propriétaires d'entreprise (par exemple, secrétaire, PDG ou vice-président).
Les DataFrame licenses
et biz_owners
sont chargés pour vous.
Cet exercice fait partie du cours
Joindre des données avec pandas
Instructions
- En partant de la table
licenses
à gauche, fusionnez-la avec la tablebiz_owners
sur la colonneaccount
, et enregistrez les résultats dans une variable nomméelicenses_owners
. - Regroupez
licenses_owners
partitle
et comptez le nombre de comptes pour chaque titre. Enregistrez le résultat souscounted_df
. - Triez
counted_df
par ordre décroissant du nombre de comptes et enregistrez ce résultat dans une variable nomméesorted_df
. - Utilisez la méthode
.head()
pour imprimer les premières lignes du fichiersorted_df
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Merge the licenses and biz_owners table on account
licenses_owners = ____
# Group the results by title then count the number of accounts
counted_df = licenses_owners.groupby(____).agg({'account':'count'})
# Sort the counted_df in descending order
sorted_df = counted_df.sort_values(____)
# Use .head() method to print the first few rows of sorted_df
print(____)