1. 学习
  2. /
  3. 课程
  4. /
  5. Łączenie danych z pandas

Connected

练习

Wykonywanie semi-join

Niektóre z utworów, które wygenerowały największe przychody, pochodzą z seriali telewizyjnych lub są innymi niemuzycznymi plikami audio. Masz do dyspozycji tabelę faktur zawierającą pozycje z najwyższymi przychodami oraz tabelę niemuzycznych ścieżek z serwisu streamingowego. W tym ćwiczeniu użyjesz semi-join, aby znaleźć niemuzyczne ścieżki generujące największe przychody.

Tabele non_mus_tcks, top_invoices oraz genres zostały już załadowane.

说明

100 XP
  • Połącz non_mus_tcks i top_invoices po kolumnie tid za pomocą złączenia wewnętrznego (inner join). Zapisz wynik jako tracks_invoices.
  • Użyj metody .isin(), aby odfiltrować wiersze z non_mus_tcks, w których wartość tid znajduje się w kolumnie tid tabeli tracks_invoices. Zapisz wynik jako top_tracks.
  • Pogrupuj top_tracks według gid i zlicz wiersze tid. Zapisz wynik do zmiennej cnt_by_gid.
  • Połącz cnt_by_gid z tabelą genres po kolumnie gid i wyświetl wynik.