Een ETL-pijplijn uitvoeren

Klaar om je eerste ETL-pijplijn te draaien? Aan de slag!

Hier zijn de functies extract(), transform() en load() al voor je gedefinieerd. Om deze ETL-pijplijn voor data uit te voeren, ga je elk van deze functies aanroepen. Ben je benieuwd? Neem gerust een kijkje hoe de extract()-functie eruitziet.

def extract(file_name):
    print(f"Extracting data from {file_name}")
    return pd.read_csv(file_name)

Deze oefening maakt deel uit van de cursus

ETL en ELT in Python

Bekijk cursus

Oefeninstructies

Gebruik de functie extract() om data uit het bestand raw_data.csv te halen.
Transformeer de DataFrame extracted_data met de functie transform().
Laad tot slot de DataFrame transformed_data naar de SQL-tabel cleaned_data.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")

# Transform the extracted_data
transformed_data = transform(data_frame=____)

# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")

Code bewerken en uitvoeren