ComeçarComece gratuitamente

Execução de uma semiconjunção

Algumas das faixas que geraram a quantidade mais significativa de receita são de TV-shows ou são outros áudios não musicais. Você recebeu uma tabela de faturas que inclui os principais itens geradores de receita. Além disso, você tem uma tabela de faixas não musicais do serviço de streaming. Neste exercício, você usará um “semi-join” para encontrar as faixas não musicais que mais geram receita.

As tabelas non_mus_tcks, top_invoices e genres foram carregadas para você.

Este exercício faz parte do curso

Unindo dados com o pandas

Ver Curso

Instruções de exercício

  • Mesclar non_mus_tcks e top_invoices em tid usando uma junção interna. Salve o resultado como tracks_invoices.
  • Use .isin() para fazer um subconjunto das linhas de non_mus_tcks onde tid está na coluna tid de tracks_invoices. Salve o resultado como top_tracks.
  • Agrupe top_tracks por gid e conte as linhas de tid. Salve o resultado em cnt_by_gid.
  • Faça a fusão de cnt_by_gid com a tabela genres em gid e imprima o resultado.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Merge the non_mus_tcks and top_invoices tables on tid
tracks_invoices = ____.merge(____)

# Use .isin() to subset non_mus_tcks to rows with tid in tracks_invoices
top_tracks = _____[non_mus_tcks['tid'].isin(____)]

# Group the top_tracks by gid and count the tid rows
cnt_by_gid = top_tracks.groupby(['gid'], as_index=False).agg({'tid':____})

# Merge the genres table to cnt_by_gid on gid and print
print(____)
Editar e executar código