ComeçarComece de graça

Quão dançáveis são as músicas hoje em dia?

Hora de mergulhar nos dados do Spotify para analisar algumas tendências na música.

Em cada arquivo CSV, a coluna 'danceability' contém a pontuação entre 0 e 1 que indica o quão dançável é cada música. Essa pontuação descreve o quão adequada a faixa é para dançar com base em uma combinação de elementos musicais, incluindo tempo, estabilidade do ritmo, força da batida e regularidade geral. Você acha que as músicas estão ficando melhores ou piores para dançar?

dask e a função delayed() já foram importados para você. pandas foi importado como pd, e matplotlib.pyplot como plt. A lista de nomes de arquivos está disponível no seu ambiente como filenames, e o ano de cada arquivo está armazenado na lista years.

Este exercício faz parte do curso

Programação Paralela com Dask em Python

Ver curso

Instruções do exercício

  • Dentro do loop, carregue cada arquivo de forma preguiçosa (lazy).
  • Usando a coluna 'danceability', encontre a média de dançabilidade das músicas em cada arquivo.
  • Compute todos os resultados na lista danceabilities e selecione o primeiro item da tupla resultante.
  • Faça um gráfico com danceability_list no eixo y e years no eixo x usando plt.plot().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

danceabilities = []

for file in filenames:
	# Lazily load in the data
    df = ____
    # Calculate the average danceability in the file of songs
    mean_danceability = ____
    danceabilities.append(mean_danceability)

# Compute all the mean danceabilities
danceability_list = ____
# Plot the results
____
plt.show()
Editar e executar o código