À quel point les morceaux sont-ils dansants aujourd’hui ?
Il est temps d’examiner plus en détail les données Spotify pour analyser certaines tendances musicales.
Dans chaque fichier CSV, la colonne 'danceability' contient une note entre 0 et 1 indiquant à quel point chaque morceau est dansant. Cette note évalue l’aptitude d’un titre à être dansé en fonction d’un ensemble d’éléments musicaux, dont le tempo, la stabilité du rythme, la puissance de la pulsation et la régularité générale. Pensez-vous que les morceaux deviennent plus ou moins dansants ?
dask et la fonction delayed() ont été importés pour vous. pandas a été importé sous le nom pd, et matplotlib.pyplot sous le nom plt. La liste des noms de fichiers est disponible dans votre environnement sous filenames, et l’année de chaque fichier est stockée dans la liste years.
Cet exercice fait partie du cours
Programmation parallèle avec Dask en Python
Instructions
- À l’intérieur de la boucle, chargez chaque fichier de manière paresseuse.
- En utilisant la colonne
'danceability', calculez la moyenne de la « danceability » des morceaux dans chaque fichier. - Calculez tous les résultats de la liste
danceabilities, puis sélectionnez le premier élément du tuple obtenu. - Créez un graphique avec
danceability_listen ordonnée etyearsen abscisse à l’aide deplt.plot().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
danceabilities = []
for file in filenames:
# Lazily load in the data
df = ____
# Calculate the average danceability in the file of songs
mean_danceability = ____
danceabilities.append(mean_danceability)
# Compute all the mean danceabilities
danceability_list = ____
# Plot the results
____
plt.show()