1. Apprendre
  2. /
  3. Cours
  4. /
  5. Assembler des données avec pandas

Connected

Exercice

Effectuer un semi-join

Certaines des pistes qui ont généré le plus de revenus proviennent d'émissions télé ou d'autres contenus audio non musicaux. On vous fournit une table de factures qui inclut les articles les plus lucratifs. Vous avez aussi une table des pistes non musicales provenant du service de diffusion en continu. Dans cet exercice, vous ferez un semi-join pour trouver les pistes non musicales les plus génératrices de revenus.

Les tables non_mus_tcks, top_invoices et genres ont été chargées pour vous.

Instructions

100 XP
  • Fusionnez non_mus_tcks et top_invoices sur tid avec une jointure interne (inner join). Enregistrez le résultat dans tracks_invoices.
  • Utilisez .isin() pour extraire les lignes de non_mus_tcks où tid se trouve dans la colonne tid de tracks_invoices. Enregistrez le résultat dans top_tracks.
  • Regroupez top_tracks par gid et comptez les lignes de tid. Enregistrez le résultat dans cnt_by_gid.
  • Fusionnez cnt_by_gid avec la table genres sur gid et affichez le résultat.