Wie tanzbar sind Songs heutzutage?
Zeit, tiefer in die Spotify-Daten einzutauchen und einige Musiktrends zu analysieren.
In jeder CSV-Datei enthält die Spalte 'danceability' den Wert zwischen 0 und 1, der angibt, wie tanzbar jeder Song ist. Der Wert beschreibt, wie gut sich ein Track zum Tanzen eignet, basierend auf einer Kombination musikalischer Elemente, darunter Tempo, Rhythmusstabilität, Beat-Stärke und allgemeine Regelmäßigkeit. Meinst du, Songs werden besser oder schlechter tanzbar?
dask und die Funktion delayed() wurden bereits importiert. pandas wurde als pd importiert, und matplotlib.pyplot als plt. Die Liste der Dateinamen steht dir in deiner Umgebung als filenames zur Verfügung, und das Jahr jeder Datei ist in der Liste years gespeichert.
Diese Übung ist Teil des Kurses
Parallele Programmierung mit Dask in Python
Anleitung zur Übung
- Lade innerhalb der Schleife jede Datei lazy (verzögert).
- Ermittle mithilfe der Spalte
'danceability'die durchschnittliche Tanzbarkeit der Songs in jeder Datei. - Berechne alle Ergebnisse in der Liste
danceabilitiesund wähle das erste Element des resultierenden Tupels. - Erstelle mit
plt.plot()ein Diagramm, bei demdanceability_listauf der y-Achse undyearsauf der x-Achse liegt.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
danceabilities = []
for file in filenames:
# Lazily load in the data
df = ____
# Calculate the average danceability in the file of songs
mean_danceability = ____
danceabilities.append(mean_danceability)
# Compute all the mean danceabilities
danceability_list = ____
# Plot the results
____
plt.show()