Execução de um semi-join
Algumas das músicas que geraram mais receita são de programas de TV ou outros áudios que não são musicais. Você recebeu uma tabela de faturas que inclui os principais itens geradores de receita. Além disso, você tem uma tabela de faixas não musicais do serviço de streaming. Neste exercício, você usará um “semi-join” para encontrar as faixas não musicais que mais geram receita.
As tabelas non_mus_tcks
, top_invoices
e genres
foram carregadas para você.
Este exercício faz parte do curso
Junção de dados com o pandas
Instruções do exercício
- Mescle
non_mus_tcks
etop_invoices
emtid
usando um “inner join”. Salve o resultado comotracks_invoices
. - Use
.isin()
para fazer um subconjunto das linhas denon_mus_tcks
ondetid
está na colunatid
detracks_invoices
. Salve o resultado comotop_tracks
. - Agrupe
top_tracks
porgid
e conte as linhas detid
. Salve o resultado emcnt_by_gid
. - Faça a mesclagem de
cnt_by_gid
com a tabelagenres
emgid
e imprima o resultado.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Merge the non_mus_tcks and top_invoices tables on tid
tracks_invoices = ____.merge(____)
# Use .isin() to subset non_mus_tcks to rows with tid in tracks_invoices
top_tracks = _____[non_mus_tcks['tid'].isin(____)]
# Group the top_tracks by gid and count the tid rows
cnt_by_gid = top_tracks.groupby(['gid'], as_index=False).agg({'tid':____})
# Merge the genres table to cnt_by_gid on gid and print
print(____)