ComenzarEmpieza gratis

Persistir datos en archivos

Cargar datos en un destino final es uno de los pasos más importantes de una canalización de datos. En este ejercicio, usarás la función transform() que aparece abajo para transformar datos de ventas de productos antes de cargarlos en un archivo .csv. Esto dará a los consumidores de datos posteriores una mejor visión de las ventas totales en una gama de productos.

Para este ejercicio, los datos de ventas ya se han cargado y transformado, y están almacenados en el DataFrame clean_sales_data. El paquete pandas se ha importado como pd, y la librería os también está lista para usarse.

Este ejercicio forma parte del curso

ETL and ELT con Python

Ver curso

Instrucciones del ejercicio

  • Actualiza la función load() para escribir los datos en la ruta proporcionada, sin cabeceras ni columna de índice.
  • Comprueba que el archivo se haya cargado en la ruta de archivo deseada.
  • Llama a la función para cargar los datos transformados en el almacenamiento persistente.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

def load(clean_data, file_path):
    # Write the data to a file
    clean_data.to_csv(file_path, ____, ____)

    # Check to make sure the file exists
    file_exists = os.____.____(____)
    if not file_exists:
        raise Exception(f"File does NOT exists at path {file_path}")

# Load the transformed data to the provided file path
____(clean_sales_data, "transformed_sales_data.csv")
Editar y ejecutar código