Quão dançáveis são as músicas hoje em dia?
Hora de mergulhar nos dados do Spotify para analisar algumas tendências na música.
Em cada arquivo CSV, a coluna 'danceability' contém a pontuação entre 0 e 1 que indica o quão dançável é cada música. Essa pontuação descreve o quão adequada a faixa é para dançar com base em uma combinação de elementos musicais, incluindo tempo, estabilidade do ritmo, força da batida e regularidade geral. Você acha que as músicas estão ficando melhores ou piores para dançar?
dask e a função delayed() já foram importados para você. pandas foi importado como pd, e matplotlib.pyplot como plt. A lista de nomes de arquivos está disponível no seu ambiente como filenames, e o ano de cada arquivo está armazenado na lista years.
Este exercício faz parte do curso
Programação Paralela com Dask em Python
Instruções do exercício
- Dentro do loop, carregue cada arquivo de forma preguiçosa (lazy).
- Usando a coluna
'danceability', encontre a média de dançabilidade das músicas em cada arquivo. - Compute todos os resultados na lista
danceabilitiese selecione o primeiro item da tupla resultante. - Faça um gráfico com
danceability_listno eixo y eyearsno eixo x usandoplt.plot().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
danceabilities = []
for file in filenames:
# Lazily load in the data
df = ____
# Calculate the average danceability in the file of songs
mean_danceability = ____
danceabilities.append(mean_danceability)
# Compute all the mean danceabilities
danceability_list = ____
# Plot the results
____
plt.show()