Aan de slagGa gratis aan de slag

Songs op Spotify analyseren

Je hebt een lijst met CSV-bestanden die je wilt samenvoegen om de Spotify-muziekcatalogus te onderzoeken. Belangrijk is dat je dit snel wilt kunnen doen en al je beschikbare rekenkracht wilt benutten.

Elk CSV-bestand bevat alle nummers die in een bepaald jaar zijn uitgebracht, en elke rij geeft informatie over een afzonderlijk nummer.

dask en delayed() zijn voor je geïmporteerd, en de lijst met bestandsnamen is in je omgeving beschikbaar als filenames. pandas is geïmporteerd als pd.

Deze oefening maakt deel uit van de cursus

Parallel programmeren met Dask in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

n_songs_in_c, n_songs = 0, 0 

for file in filenames:
    # Load in the data
    df = ____(____)(____)
Code bewerken en uitvoeren