ComeçarComece de graça

Execução de um semi-join

Algumas das músicas que geraram mais receita são de programas de TV ou outros áudios que não são musicais. Você recebeu uma tabela de faturas que inclui os principais itens geradores de receita. Além disso, você tem uma tabela de faixas não musicais do serviço de streaming. Neste exercício, você usará um “semi-join” para encontrar as faixas não musicais que mais geram receita.

As tabelas non_mus_tcks, top_invoices e genres foram carregadas para você.

Este exercício faz parte do curso

Junção de dados com o pandas

Ver curso

Instruções do exercício

  • Mescle non_mus_tcks e top_invoices em tid usando um “inner join”. Salve o resultado como tracks_invoices.
  • Use .isin() para fazer um subconjunto das linhas de non_mus_tcks onde tid está na coluna tid de tracks_invoices. Salve o resultado como top_tracks.
  • Agrupe top_tracks por gid e conte as linhas de tid. Salve o resultado em cnt_by_gid.
  • Faça a mesclagem de cnt_by_gid com a tabela genres em gid e imprima o resultado.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Merge the non_mus_tcks and top_invoices tables on tid
tracks_invoices = ____.merge(____)

# Use .isin() to subset non_mus_tcks to rows with tid in tracks_invoices
top_tracks = _____[non_mus_tcks['tid'].isin(____)]

# Group the top_tracks by gid and count the tid rows
cnt_by_gid = top_tracks.groupby(['gid'], as_index=False).agg({'tid':____})

# Merge the genres table to cnt_by_gid on gid and print
print(____)
Editar e executar o código