Cargar datos de ventas en un archivo CSV
La carga de datos es un componente esencial de cualquier canalización de datos. Garantiza que todos los consumidores de datos y procesos tengan un acceso fiable a los datos que has extraído y transformado anteriormente en una canalización. En este ejercicio, practicarás la carga de datos de ventas transformados en un archivo CSV utilizando pandas, que se ha importado como pd. Además, se han extraído los datos brutos y están disponibles en el DataFrame raw_sales_data.
Este ejercicio forma parte del curso
ETL y ELT en Python
Instrucciones del ejercicio
- Filtra el DataFrame
raw_sales_datapara conservar sólo todos los artículos con un precio inferior a 25 dólares. - Actualiza la función
load()para escribir los datos de ventas transformados en un archivo llamado"transformed_sales_data.csv", asegurándote de no incluir la columnaindex. - Llama a la función
load()en el Marco de Datos depurado.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def transform(raw_data):
# Find the items prices less than 25 dollars
return raw_data.loc[raw_data["Price Each"] ____ ____, ["Order ID", "Product", "Price Each", "Order Date"]]
def load(clean_data):
# Write the data to a CSV file without the index column
____.____("transformed_sales_data.csv", index=____)
clean_sales_data = transform(raw_sales_data)
# Call the load function on the cleaned DataFrame
____(____)