Carga de datos de ventas en un archivo CSV
La carga de datos es un componente esencial de cualquier canalización de datos. Garantiza que todos los consumidores de datos y procesos tengan un acceso fiable a los datos que has extraído y transformado anteriormente en una canalización. En este ejercicio, practicarás la carga de datos de ventas transformados en un archivo CSV utilizando pandas
, que se ha importado como pd
. Además, se han extraído los datos brutos y están disponibles en el DataFrame raw_sales_data
.
Este ejercicio forma parte del curso
Introducción a las canalizaciones de datos
Instrucciones de ejercicio
- Filtra el DataFrame
raw_sales_data
para conservar sólo todos los artículos con un precio inferior a 25 dólares. - Actualiza la función
load()
para escribir los datos de ventas transformados en un archivo llamado"transformed_sales_data.csv"
, asegurándote de no incluir la columnaindex
. - Llama a la función
load()
en el Marco de Datos depurado.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
def transform(raw_data):
# Find the items prices less than 25 dollars
return raw_data.loc[raw_data["Price Each"] ____ ____, ["Order ID", "Product", "Price Each", "Order Date"]]
def load(clean_data):
# Write the data to a CSV file without the index column
return ____.____("transformed_sales_data.csv", index=____)
clean_sales_data = transform(raw_sales_data)
# Call the load function on the cleaned DataFrame
____(____)