IniziaInizia gratis

Caricare i dati di vendita in un file CSV

Caricare i dati è una componente essenziale di qualsiasi pipeline di dati. Garantisce che i consumatori di dati e i processi abbiano accesso affidabile ai dati che hai estratto e trasformato in precedenza nella pipeline. In questo esercizio, metterai in pratica il caricamento dei dati di vendita trasformati in un file CSV usando pandas, importato come pd. Inoltre, i dati grezzi sono già stati estratti e sono disponibili nel DataFrame raw_sales_data.

Questo esercizio fa parte del corso

ETL and ELT in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Filtra il DataFrame raw_sales_data per mantenere solo gli articoli con un prezzo inferiore a 25 dollari.
  • Aggiorna la funzione load() per scrivere i dati di vendita trasformati in un file chiamato "transformed_sales_data.csv", assicurandoti di non includere la colonna index.
  • Chiama la funzione load() sul DataFrame ripulito.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

def transform(raw_data):
	# Find the items prices less than 25 dollars
	return raw_data.loc[raw_data["Price Each"] ____ ____, ["Order ID", "Product", "Price Each", "Order Date"]]

def load(clean_data):
	# Write the data to a CSV file without the index column
	____.____("transformed_sales_data.csv", index=____)


clean_sales_data = transform(raw_sales_data)

# Call the load function on the cleaned DataFrame
____(____)
Modifica ed esegui il codice