CommencerCommencer gratuitement

À quel point les morceaux sont-ils dansants aujourd’hui ?

Il est temps d’examiner plus en détail les données Spotify pour analyser certaines tendances musicales.

Dans chaque fichier CSV, la colonne 'danceability' contient une note entre 0 et 1 indiquant à quel point chaque morceau est dansant. Cette note évalue l’aptitude d’un titre à être dansé en fonction d’un ensemble d’éléments musicaux, dont le tempo, la stabilité du rythme, la puissance de la pulsation et la régularité générale. Pensez-vous que les morceaux deviennent plus ou moins dansants ?

dask et la fonction delayed() ont été importés pour vous. pandas a été importé sous le nom pd, et matplotlib.pyplot sous le nom plt. La liste des noms de fichiers est disponible dans votre environnement sous filenames, et l’année de chaque fichier est stockée dans la liste years.

Cet exercice fait partie du cours

Programmation parallèle avec Dask en Python

Afficher le cours

Instructions

  • À l’intérieur de la boucle, chargez chaque fichier de manière paresseuse.
  • En utilisant la colonne 'danceability', calculez la moyenne de la « danceability » des morceaux dans chaque fichier.
  • Calculez tous les résultats de la liste danceabilities, puis sélectionnez le premier élément du tuple obtenu.
  • Créez un graphique avec danceability_list en ordonnée et years en abscisse à l’aide de plt.plot().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

danceabilities = []

for file in filenames:
	# Lazily load in the data
    df = ____
    # Calculate the average danceability in the file of songs
    mean_danceability = ____
    danceabilities.append(mean_danceability)

# Compute all the mean danceabilities
danceability_list = ____
# Plot the results
____
plt.show()
Modifier et exécuter le code