Hoe dansbaar zijn songs tegenwoordig?
Tijd om dieper in de Spotify-data te duiken en muziektrends te analyseren.
In elk CSV-bestand bevat de kolom 'danceability' een score tussen 0 en 1 die aangeeft hoe dansbaar elke song is. De score beschrijft hoe geschikt een track is om op te dansen op basis van een combinatie van muzikale elementen, waaronder tempo, ritmestabiliteit, beat-kracht en algemene regelmaat. Denk je dat songs beter of slechter worden om op te dansen?
dask en de functie delayed() zijn al voor je geïmporteerd. pandas is geïmporteerd als pd, en matplotlib.pyplot is geïmporteerd als plt. De lijst met bestandsnamen is beschikbaar in je omgeving als filenames, en het jaar van elk bestand staat in de lijst years.
Deze oefening maakt deel uit van de cursus
Parallel programmeren met Dask in Python
Oefeninstructies
- Laad in de lus elk bestand lui in.
- Gebruik de kolom
'danceability'om de gemiddelde dansbaarheid van songs in elk bestand te vinden. - Bereken alle resultaten in de lijst
danceabilities, en selecteer het eerste item van de resulterende tuple. - Maak een plot met
danceability_listop de y-as enyearsop de x-as metplt.plot().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
danceabilities = []
for file in filenames:
# Lazily load in the data
df = ____
# Calculate the average danceability in the file of songs
mean_danceability = ____
danceabilities.append(mean_danceability)
# Compute all the mean danceabilities
danceability_list = ____
# Plot the results
____
plt.show()