Aan de slagGa gratis aan de slag

Transformaties van data valideren

Goed bezig tot nu toe! Handmatig steekproefsgewijs transformaties controleren is een goede eerste stap om te zorgen dat je de datakwaliteit in de hele pijplijn bewaakt. pandas biedt verschillende ingebouwde functies die je daarbij helpen!

Om je op weg te helpen in deze oefening is pandas al geïmporteerd als pd.

Deze oefening maakt deel uit van de cursus

ETL en ELT in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

def extract(file_path):
  	# Ingest the data to a DataFrame
    raw_data = pd.____(____)
    
    # Return the DataFrame
    return raw_data
  
raw_sales_data = extract("sales_data.parquet")
Code bewerken en uitvoeren