LoslegenKostenlos loslegen

Laden von Verkaufsdaten in eine CSV Datei

Das Laden von Daten ist ein wesentlicher Bestandteil jeder Datenpipeline. Sie stellt sicher, dass alle Datenkonsumenten und -prozesse zuverlässig auf Daten zugreifen können, die du zuvor in einer Pipeline extrahiert und umgewandelt hast. In dieser Übung übst du das Laden von transformierten Verkaufsdaten in eine CSV Datei mit pandas, die als pd importiert wurde. Darüber hinaus wurden die Rohdaten extrahiert und sind im DataFrame raw_sales_data verfügbar.

Diese Übung ist Teil des Kurses

ETL und ELT in Python

Kurs anzeigen

Anleitung zur Übung

  • Filtere den raw_sales_data DataFrame so, dass nur alle Artikel mit einem Preis von weniger als 25 Dollar erhalten bleiben.
  • Aktualisiere die Funktion load(), um die umgewandelten Verkaufsdaten in eine Datei mit dem Namen "transformed_sales_data.csv" zu schreiben und stelle sicher, dass die Spalte index nicht enthalten ist.
  • Rufe die Funktion load() für den bereinigten Datenrahmen auf.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

def transform(raw_data):
	# Find the items prices less than 25 dollars
	return raw_data.loc[raw_data["Price Each"] ____ ____, ["Order ID", "Product", "Price Each", "Order Date"]]

def load(clean_data):
	# Write the data to a CSV file without the index column
	____.____("transformed_sales_data.csv", index=____)


clean_sales_data = transform(raw_sales_data)

# Call the load function on the cleaned DataFrame
____(____)
Code bearbeiten und ausführen