ComenzarEmpieza gratis

Crear DataFrames de Dask desde CSV

Antes analizaste los datos de canciones de Spotify usando bucles y funciones aplazadas. Ahora ya sabes que puedes lograr lo mismo de forma más sencilla con un Dask DataFrame. Veamos lo mucho que se simplifican las mismas tareas que hiciste antes si las haces con estos métodos en lugar de bucles. Pero primero, necesitas cargar el conjunto de datos en un Dask DataFrame.

Este ejercicio forma parte del curso

Programación paralela con Dask en Python

Ver curso

Instrucciones del ejercicio

  • Importa el subpaquete dask.dataframe como dd.
  • Lee todos los archivos CSV de la carpeta data/spotify usando un blocksize máximo de 1MB.
  • Usa la función dd.to_datetime() para convertir las cadenas de la columna 'release_date' a objetos datetime.
  • Usa el método .head() del DataFrame para mostrar 5 filas de la tabla.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import dask dataframe as dd
____

# Load in the DataFrame
df  = ____

# Convert the release_date column from string to datetime
____

# Show 5 rows of the DataFrame
print(____)
Editar y ejecutar código