Aufbau einer ETL-Pipeline
Bist du bereit, den Spaß zu erhöhen? In dieser Übung bist du dafür verantwortlich, den Rest der Funktion load()
zu erstellen, bevor du die einzelnen Schritte des ETL-Prozesses ausführst. Die Funktionen extract()
und transform()
sind für dich definiert worden. Viel Erfolg!
Diese Übung ist Teil des Kurses
ETL und ELT in Python
Anleitung zur Übung
- Vervollständige die Funktion
load()
, indem du dentransformed_data
DataFrame mitfile_name
in eine.csv
Datei schreibst. - Verwende die Funktion
transform()
, um denextracted_data
DataFrame zu bereinigen. - Lade
transformed_data
mit der Funktionload()
in die Dateitransformed_data.csv
.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
def load(data_frame, file_name):
# Write cleaned_data to a CSV using file_name
data_frame.____(____)
print(f"Successfully loaded data to {file_name}")
extracted_data = extract(file_name="raw_data.csv")
# Transform extracted_data using transform() function
transformed_data = ____(data_frame=____)
# Load transformed_data to the file transformed_data.csv
____(data_frame=____, file_name="transformed_data.csv")