Laden von Verkaufsdaten in eine CSV Datei
Das Laden von Daten ist ein wesentlicher Bestandteil jeder Datenpipeline. Sie stellt sicher, dass alle Datenkonsumenten und -prozesse zuverlässig auf Daten zugreifen können, die du zuvor in einer Pipeline extrahiert und umgewandelt hast. In dieser Übung übst du das Laden von transformierten Verkaufsdaten in eine CSV Datei mit pandas, die als pd importiert wurde. Darüber hinaus wurden die Rohdaten extrahiert und sind im DataFrame raw_sales_data verfügbar.
Diese Übung ist Teil des Kurses
ETL und ELT in Python
Anleitung zur Übung
- Filtere den
raw_sales_dataDataFrame so, dass nur alle Artikel mit einem Preis von weniger als 25 Dollar erhalten bleiben. - Aktualisiere die Funktion
load(), um die umgewandelten Verkaufsdaten in eine Datei mit dem Namen"transformed_sales_data.csv"zu schreiben und stelle sicher, dass die Spalteindexnicht enthalten ist. - Rufe die Funktion
load()für den bereinigten Datenrahmen auf.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
def transform(raw_data):
# Find the items prices less than 25 dollars
return raw_data.loc[raw_data["Price Each"] ____ ____, ["Order ID", "Product", "Price Each", "Order Date"]]
def load(clean_data):
# Write the data to a CSV file without the index column
____.____("transformed_sales_data.csv", index=____)
clean_sales_data = transform(raw_sales_data)
# Call the load function on the cleaned DataFrame
____(____)