Caricare i dati di vendita in un file CSV
Caricare i dati è una componente essenziale di qualsiasi pipeline di dati. Garantisce che i consumatori di dati e i processi abbiano accesso affidabile ai dati che hai estratto e trasformato in precedenza nella pipeline. In questo esercizio, metterai in pratica il caricamento dei dati di vendita trasformati in un file CSV usando pandas, importato come pd. Inoltre, i dati grezzi sono già stati estratti e sono disponibili nel DataFrame raw_sales_data.
Questo esercizio fa parte del corso
ETL and ELT in Python
Istruzioni dell'esercizio
- Filtra il DataFrame
raw_sales_dataper mantenere solo gli articoli con un prezzo inferiore a 25 dollari. - Aggiorna la funzione
load()per scrivere i dati di vendita trasformati in un file chiamato"transformed_sales_data.csv", assicurandoti di non includere la colonnaindex. - Chiama la funzione
load()sul DataFrame ripulito.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
def transform(raw_data):
# Find the items prices less than 25 dollars
return raw_data.loc[raw_data["Price Each"] ____ ____, ["Order ID", "Product", "Price Each", "Order Date"]]
def load(clean_data):
# Write the data to a CSV file without the index column
____.____("transformed_sales_data.csv", index=____)
clean_sales_data = transform(raw_sales_data)
# Call the load function on the cleaned DataFrame
____(____)