Analyser des morceaux sur Spotify
Vous disposez d’une liste de fichiers CSV à agréger pour explorer le catalogue musical de Spotify. Point important : vous souhaitez le faire rapidement et tirer parti de toute la puissance de calcul disponible.
Chaque fichier CSV contient tous les morceaux sortis une année donnée, et chaque ligne décrit un morceau individuel.
dask et delayed() ont été importés pour vous, et la liste des noms de fichiers est disponible dans votre environnement sous filenames. pandas a été importé sous le nom pd.
Cet exercice fait partie du cours
Programmation parallèle avec Dask en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
n_songs_in_c, n_songs = 0, 0
for file in filenames:
# Load in the data
df = ____(____)(____)