CommencerCommencer gratuitement

Fusion de un-à-plusieurs

Une entreprise peut avoir un ou plusieurs propriétaires. Dans cet exercice, vous allez continuer à acquérir de l'expérience avec les fusions un-à-plusieurs en fusionnant une table de propriétaires d'entreprises, appelée biz_owners, avec la table licenses. Rappelez-vous de la leçon vidéo : dans le cas d'une relation de type « un-à-plusieurs », une ligne de la table de gauche peut être répétée si elle est liée à plusieurs lignes de la table de droite. Dans cette leçon, vous approfondirez cette question en découvrant quel est le titre le plus courant des propriétaires d'entreprise (par exemple, secrétaire, PDG ou vice-président).

Les DataFrame licenses et biz_owners sont chargés pour vous.

Cet exercice fait partie du cours

Joindre des données avec pandas

Afficher le cours

Instructions

  • En partant de la table licenses à gauche, fusionnez-la avec la table biz_owners sur la colonne account, et enregistrez les résultats dans une variable nommée licenses_owners.
  • Regroupez licenses_owners par title et comptez le nombre de comptes pour chaque titre. Enregistrez le résultat sous counted_df.
  • Triez counted_df par ordre décroissant du nombre de comptes et enregistrez ce résultat dans une variable nommée sorted_df.
  • Utilisez la méthode .head() pour imprimer les premières lignes du fichier sorted_df.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Merge the licenses and biz_owners table on account
licenses_owners = ____

# Group the results by title then count the number of accounts
counted_df = licenses_owners.groupby(____).agg({'account':'count'})

# Sort the counted_df in descending order
sorted_df = counted_df.sort_values(____)

# Use .head() method to print the first few rows of sorted_df
print(____)
Modifier et exécuter le code