Aan de slagGa gratis aan de slag

Hoe dansbaar zijn songs tegenwoordig?

Tijd om dieper in de Spotify-data te duiken en muziektrends te analyseren.

In elk CSV-bestand bevat de kolom 'danceability' een score tussen 0 en 1 die aangeeft hoe dansbaar elke song is. De score beschrijft hoe geschikt een track is om op te dansen op basis van een combinatie van muzikale elementen, waaronder tempo, ritmestabiliteit, beat-kracht en algemene regelmaat. Denk je dat songs beter of slechter worden om op te dansen?

dask en de functie delayed() zijn al voor je geïmporteerd. pandas is geïmporteerd als pd, en matplotlib.pyplot is geïmporteerd als plt. De lijst met bestandsnamen is beschikbaar in je omgeving als filenames, en het jaar van elk bestand staat in de lijst years.

Deze oefening maakt deel uit van de cursus

Parallel programmeren met Dask in Python

Cursus bekijken

Oefeninstructies

  • Laad in de lus elk bestand lui in.
  • Gebruik de kolom 'danceability' om de gemiddelde dansbaarheid van songs in elk bestand te vinden.
  • Bereken alle resultaten in de lijst danceabilities, en selecteer het eerste item van de resulterende tuple.
  • Maak een plot met danceability_list op de y-as en years op de x-as met plt.plot().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

danceabilities = []

for file in filenames:
	# Lazily load in the data
    df = ____
    # Calculate the average danceability in the file of songs
    mean_danceability = ____
    danceabilities.append(mean_danceability)

# Compute all the mean danceabilities
danceability_list = ____
# Plot the results
____
plt.show()
Code bewerken en uitvoeren