LoslegenKostenlos loslegen

Ausführen einer ETL-Pipeline

Bist du bereit, deine erste ETL-Pipeline zu betreiben? Los geht’s!

Hier sind die Funktionen extract(), transform() und load() für dich definiert worden. Um diese Daten-ETL-Pipeline auszuführen, musst du jede dieser Funktionen ausführen. Wenn du neugierig bist, sieh dir an, wie die Funktion extract() aussieht.

def extract(file_name):
    print(f"Extracting data from {file_name}")
    return pd.read_csv(file_name)

Diese Übung ist Teil des Kurses

ETL und ELT in Python

Kurs anzeigen

Anleitung zur Übung

  • Verwende die Funktion extract(), um Daten aus der Datei raw_data.csv zu extrahieren.
  • Transformiere den DataFrame extracted_data mit der Funktion transform().
  • Lade schließlich den DataFrame transformed_data in die SQL-Tabelle cleaned_data.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")

# Transform the extracted_data
transformed_data = transform(data_frame=____)

# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")
Code bearbeiten und ausführen