LoslegenKostenlos starten

Laden von Verkaufsdaten in eine CSV Datei

Das Laden von Daten ist ein wesentlicher Bestandteil jeder Datenpipeline. Sie stellt sicher, dass alle Datenkonsumenten und -prozesse zuverlässig auf Daten zugreifen können, die du zuvor in einer Pipeline extrahiert und umgewandelt hast. In dieser Übung übst du das Laden von transformierten Verkaufsdaten in eine CSV Datei mit pandas, die als pd importiert wurde. Darüber hinaus wurden die Rohdaten extrahiert und sind im DataFrame raw_sales_data verfügbar.

Diese Übung ist Teil des Kurses

<Kurs>ETL und ELT mit Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Filtere den raw_sales_data DataFrame so, dass nur alle Artikel mit einem Preis von weniger als 25 Dollar erhalten bleiben.
  • Aktualisiere die Funktion load(), um die umgewandelten Verkaufsdaten in eine Datei mit dem Namen "transformed_sales_data.csv" zu schreiben und stelle sicher, dass die Spalte index nicht enthalten ist.
  • Rufe die Funktion load() für den bereinigten Datenrahmen auf.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

def transform(raw_data):
	# Find the items prices less than 25 dollars
	return raw_data.loc[raw_data["Price Each"] ____ ____, ["Order ID", "Product", "Price Each", "Order Date"]]

def load(clean_data):
	# Write the data to a CSV file without the index column
	____.____("transformed_sales_data.csv", index=____)


clean_sales_data = transform(raw_sales_data)

# Call the load function on the cleaned DataFrame
____(____)
Code bearbeiten und ausführen