Persistencia de datos en ficheros
La carga de datos en un destino final es uno de los pasos más importantes de una canalización de datos. En este ejercicio, utilizarás la función transform()
que se muestra a continuación para transformar los datos de ventas de productos antes de cargarlos en un archivo .csv
. Esto dará a los consumidores de datos posteriores una mejor visión de las ventas totales de una serie de productos.
Para este ejercicio, los datos de ventas se han cargado y transformado, y se almacenan en el DataFrame clean_sales_data
. El paquete pandas
se ha importado como pd
, ¡y la biblioteca os
también está lista para ser utilizada!
Este ejercicio forma parte del curso
Introducción a las canalizaciones de datos
Instrucciones de ejercicio
- Actualiza la función
load()
para escribir datos en la ruta proporcionada, sin cabeceras ni columna índice. - Comprueba que el archivo se ha cargado en la ruta deseada.
- Llama a la función para cargar los datos transformados en el almacenamiento persistente.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
def load(clean_data, file_path):
# Write the data to a file
clean_data.to_csv(file_path, ____, ____)
# Check to make sure the file exists
file_exists = os.____.____(____)
if not file_exists:
raise Exception(f"File does NOT exists at path {file_path}")
# Load the transformed data to the provided file path
____(clean_sales_data, "transformed_sales_data.csv")