IniziaInizia gratis

Creare Dask DataFrame da file CSV

In precedenza hai analizzato i dati delle canzoni di Spotify usando cicli e funzioni ritardate. Ora sai che puoi ottenere lo stesso risultato in modo più semplice usando un Dask DataFrame. Vediamo quanto sono più semplici gli stessi compiti se li esegui con questi metodi invece dei cicli. Prima, però, devi caricare l'insieme di dati in un Dask DataFrame.

Questo esercizio fa parte del corso

Programmazione parallela con Dask in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa il sottopacchetto dask.dataframe come dd.
  • Leggi tutti i file CSV nella cartella data/spotify usando una dimensione massima di blocco di 1MB.
  • Usa la funzione dd.to_datetime() per convertire le stringhe nella colonna 'release_date' in datetime.
  • Usa il metodo .head() del DataFrame per mostrare 5 righe della tabella.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import dask dataframe as dd
____

# Load in the DataFrame
df  = ____

# Convert the release_date column from string to datetime
____

# Show 5 rows of the DataFrame
print(____)
Modifica ed esegui il codice