CommencerCommencer gratuitement

Analyser des morceaux sur Spotify

Vous disposez d’une liste de fichiers CSV à agréger pour explorer le catalogue musical de Spotify. Point important : vous souhaitez le faire rapidement et tirer parti de toute la puissance de calcul disponible.

Chaque fichier CSV contient tous les morceaux sortis une année donnée, et chaque ligne décrit un morceau individuel.

dask et delayed() ont été importés pour vous, et la liste des noms de fichiers est disponible dans votre environnement sous filenames. pandas a été importé sous le nom pd.

Cet exercice fait partie du cours

Programmation parallèle avec Dask en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

n_songs_in_c, n_songs = 0, 0 

for file in filenames:
    # Load in the data
    df = ____(____)(____)
Modifier et exécuter le code