Erste SchritteKostenlos loslegen

Laden von Verkaufsdaten in eine CSV-Datei

Das Laden von Daten ist ein wesentlicher Bestandteil jeder Datenpipeline. Sie stellt sicher, dass alle Datenkonsumenten und -prozesse zuverlässig auf Daten zugreifen können, die du zuvor in einer Pipeline extrahiert und umgewandelt hast. In dieser Übung übst du das Laden von umgewandelten Verkaufsdaten in eine CSV-Datei mit pandas, die als pd importiert wurde. Darüber hinaus wurden die Rohdaten extrahiert und sind im DataFrame raw_sales_data verfügbar.

Diese Übung ist Teil des Kurses

ETL und ELT in Python

Kurs anzeigen

Anleitung zur Übung

  • Filtere den raw_sales_data DataFrame so, dass nur alle Artikel mit einem Preis von weniger als 25 Dollar erhalten bleiben.
  • Aktualisiere die Funktion load(), um die umgewandelten Verkaufsdaten in eine Datei mit dem Namen "transformed_sales_data.csv" zu schreiben und stelle sicher, dass die Spalte index nicht enthalten ist.
  • Rufe die Funktion load() für den bereinigten Datenrahmen auf.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

def transform(raw_data):
	# Find the items prices less than 25 dollars
	return raw_data.loc[raw_data["Price Each"] ____ ____, ["Order ID", "Product", "Price Each", "Order Date"]]

def load(clean_data):
	# Write the data to a CSV file without the index column
	____.____("transformed_sales_data.csv", index=____)


clean_sales_data = transform(raw_sales_data)

# Call the load function on the cleaned DataFrame
____(____)
Bearbeiten und Ausführen von Code