Creare Dask DataFrame da file CSV
In precedenza hai analizzato i dati delle canzoni di Spotify usando cicli e funzioni ritardate. Ora sai che puoi ottenere lo stesso risultato in modo più semplice usando un Dask DataFrame. Vediamo quanto sono più semplici gli stessi compiti se li esegui con questi metodi invece dei cicli. Prima, però, devi caricare l'insieme di dati in un Dask DataFrame.
Questo esercizio fa parte del corso
Programmazione parallela con Dask in Python
Istruzioni dell'esercizio
- Importa il sottopacchetto
dask.dataframecomedd. - Leggi tutti i file CSV nella cartella
data/spotifyusando una dimensione massima di blocco di 1MB. - Usa la funzione
dd.to_datetime()per convertire le stringhe nella colonna'release_date'in datetime. - Usa il metodo
.head()del DataFrame per mostrare 5 righe della tabella.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import dask dataframe as dd
____
# Load in the DataFrame
df = ____
# Convert the release_date column from string to datetime
____
# Show 5 rows of the DataFrame
print(____)