Execução de uma semiconjunção
Algumas das faixas que geraram a quantidade mais significativa de receita são de TV-shows ou são outros áudios não musicais. Você recebeu uma tabela de faturas que inclui os principais itens geradores de receita. Além disso, você tem uma tabela de faixas não musicais do serviço de streaming. Neste exercício, você usará um “semi-join” para encontrar as faixas não musicais que mais geram receita.
As tabelas non_mus_tcks
, top_invoices
e genres
foram carregadas para você.
Este exercício faz parte do curso
Unindo dados com o pandas
Instruções de exercício
- Mesclar
non_mus_tcks
etop_invoices
emtid
usando uma junção interna. Salve o resultado comotracks_invoices
. - Use
.isin()
para fazer um subconjunto das linhas denon_mus_tcks
ondetid
está na colunatid
detracks_invoices
. Salve o resultado comotop_tracks
. - Agrupe
top_tracks
porgid
e conte as linhas detid
. Salve o resultado emcnt_by_gid
. - Faça a fusão de
cnt_by_gid
com a tabelagenres
emgid
e imprima o resultado.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Merge the non_mus_tcks and top_invoices tables on tid
tracks_invoices = ____.merge(____)
# Use .isin() to subset non_mus_tcks to rows with tid in tracks_invoices
top_tracks = _____[non_mus_tcks['tid'].isin(____)]
# Group the top_tracks by gid and count the tid rows
cnt_by_gid = top_tracks.groupby(['gid'], as_index=False).agg({'tid':____})
# Merge the genres table to cnt_by_gid on gid and print
print(____)