Persistir datos en archivos
Cargar datos en un destino final es uno de los pasos más importantes de una canalización de datos. En este ejercicio, usarás la función transform() que aparece abajo para transformar datos de ventas de productos antes de cargarlos en un archivo .csv. Esto dará a los consumidores de datos posteriores una mejor visión de las ventas totales en una gama de productos.
Para este ejercicio, los datos de ventas ya se han cargado y transformado, y están almacenados en el DataFrame clean_sales_data. El paquete pandas se ha importado como pd, y la librería os también está lista para usarse.
Este ejercicio forma parte del curso
ETL and ELT con Python
Instrucciones del ejercicio
- Actualiza la función
load()para escribir los datos en la ruta proporcionada, sin cabeceras ni columna de índice. - Comprueba que el archivo se haya cargado en la ruta de archivo deseada.
- Llama a la función para cargar los datos transformados en el almacenamiento persistente.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def load(clean_data, file_path):
# Write the data to a file
clean_data.to_csv(file_path, ____, ____)
# Check to make sure the file exists
file_exists = os.____.____(____)
if not file_exists:
raise Exception(f"File does NOT exists at path {file_path}")
# Load the transformed data to the provided file path
____(clean_sales_data, "transformed_sales_data.csv")