¿Qué tan bailables son las canciones hoy en día?
Es hora de profundizar en los datos de Spotify para analizar algunas tendencias en la música.
En cada archivo CSV, la columna 'danceability' contiene una puntuación entre 0 y 1 que indica qué tan bailable es cada canción. La puntuación describe lo adecuada que es una pista para bailar según una combinación de elementos musicales, como el tempo, la estabilidad del ritmo, la fuerza del pulso y la regularidad general. ¿Crees que las canciones están mejorando o empeorando para bailar?
Se han importado dask y la función delayed() para ti. pandas se ha importado como pd, y matplotlib.pyplot se ha importado como plt. La lista de nombres de archivo está disponible en tu entorno como filenames, y el año de cada archivo está almacenado en la lista years.
Este ejercicio forma parte del curso
Programación paralela con Dask en Python
Instrucciones del ejercicio
- Dentro del bucle, carga perezosamente cada archivo.
- Usando la columna
'danceability', calcula la media de bailabilidad de las canciones de cada archivo. - Calcula todos los resultados de la lista
danceabilitiesy selecciona el primer elemento de la tupla resultante. - Haz un gráfico con
danceability_listen el eje y yyearsen el eje x usandoplt.plot().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
danceabilities = []
for file in filenames:
# Lazily load in the data
df = ____
# Calculate the average danceability in the file of songs
mean_danceability = ____
danceabilities.append(mean_danceability)
# Compute all the mean danceabilities
danceability_list = ____
# Plot the results
____
plt.show()