LoslegenKostenlos loslegen

Eine ETL-Pipeline ausführen

Bereit, deine erste ETL-Pipeline auszuführen? Los geht’s!

Hier wurden die Funktionen extract(), transform() und load() bereits für dich definiert. Um diese ETL-Datenpipeline auszuführen, rufst du jede dieser Funktionen auf. Wenn du neugierig bist, wirf einen Blick darauf, wie die Funktion extract() aussieht.

def extract(file_name):
    print(f"Extracting data from {file_name}")
    return pd.read_csv(file_name)

Diese Übung ist Teil des Kurses

ETL und ELT in Python

Kurs anzeigen

Anleitung zur Übung

  • Verwende die Funktion extract(), um Daten aus der Datei raw_data.csv zu extrahieren.
  • Transformiere das DataFrame extracted_data mit der Funktion transform().
  • Lade schließlich das DataFrame transformed_data in die SQL-Tabelle cleaned_data.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")

# Transform the extracted_data
transformed_data = transform(data_frame=____)

# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")
Code bearbeiten und ausführen