Ausführen einer ETL-Pipeline
Bist du bereit, deine erste ETL-Pipeline zu betreiben? Los geht’s!
Hier sind die Funktionen extract()
, transform()
und load()
für dich definiert worden. Um diese Daten-ETL-Pipeline auszuführen, musst du jede dieser Funktionen ausführen. Wenn du neugierig bist, sieh dir an, wie die Funktion extract()
aussieht.
def extract(file_name):
print(f"Extracting data from {file_name}")
return pd.read_csv(file_name)
Diese Übung ist Teil des Kurses
ETL und ELT in Python
Anleitung zur Übung
- Verwende die Funktion
extract()
, um Daten aus der Dateiraw_data.csv
zu extrahieren. - Transformiere den DataFrame
extracted_data
mit der Funktiontransform()
. - Lade schließlich den DataFrame
transformed_data
in die SQL-Tabellecleaned_data
.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")
# Transform the extracted_data
transformed_data = transform(data_frame=____)
# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")