Crear DataFrames de Dask desde CSV
Antes analizaste los datos de canciones de Spotify usando bucles y funciones aplazadas. Ahora ya sabes que puedes lograr lo mismo de forma más sencilla con un Dask DataFrame. Veamos lo mucho que se simplifican las mismas tareas que hiciste antes si las haces con estos métodos en lugar de bucles. Pero primero, necesitas cargar el conjunto de datos en un Dask DataFrame.
Este ejercicio forma parte del curso
Programación paralela con Dask en Python
Instrucciones del ejercicio
- Importa el subpaquete
dask.dataframecomodd. - Lee todos los archivos CSV de la carpeta
data/spotifyusando unblocksizemáximo de 1MB. - Usa la función
dd.to_datetime()para convertir las cadenas de la columna'release_date'a objetos datetime. - Usa el método
.head()del DataFrame para mostrar 5 filas de la tabla.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import dask dataframe as dd
____
# Load in the DataFrame
df = ____
# Convert the release_date column from string to datetime
____
# Show 5 rows of the DataFrame
print(____)