Laden von Verkaufsdaten in eine CSV-Datei
Das Laden von Daten ist ein wesentlicher Bestandteil jeder Datenpipeline. Sie stellt sicher, dass alle Datenkonsumenten und -prozesse zuverlässig auf Daten zugreifen können, die du zuvor in einer Pipeline extrahiert und umgewandelt hast. In dieser Übung übst du das Laden von umgewandelten Verkaufsdaten in eine CSV-Datei mit pandas
, die als pd
importiert wurde. Darüber hinaus wurden die Rohdaten extrahiert und sind im DataFrame raw_sales_data
verfügbar.
Diese Übung ist Teil des Kurses
ETL und ELT in Python
Anleitung zur Übung
- Filtere den
raw_sales_data
DataFrame so, dass nur alle Artikel mit einem Preis von weniger als 25 Dollar erhalten bleiben. - Aktualisiere die Funktion
load()
, um die umgewandelten Verkaufsdaten in eine Datei mit dem Namen"transformed_sales_data.csv"
zu schreiben und stelle sicher, dass die Spalteindex
nicht enthalten ist. - Rufe die Funktion
load()
für den bereinigten Datenrahmen auf.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
def transform(raw_data):
# Find the items prices less than 25 dollars
return raw_data.loc[raw_data["Price Each"] ____ ____, ["Order ID", "Product", "Price Each", "Order Date"]]
def load(clean_data):
# Write the data to a CSV file without the index column
____.____("transformed_sales_data.csv", index=____)
clean_sales_data = transform(raw_sales_data)
# Call the load function on the cleaned DataFrame
____(____)