Transformaties van data valideren
Goed bezig tot nu toe! Handmatig steekproefsgewijs transformaties controleren is een goede eerste stap om te zorgen dat je de datakwaliteit in de hele pijplijn bewaakt. pandas biedt verschillende ingebouwde functies die je daarbij helpen!
Om je op weg te helpen in deze oefening is pandas al geïmporteerd als pd.
Deze oefening maakt deel uit van de cursus
ETL en ELT in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
def extract(file_path):
# Ingest the data to a DataFrame
raw_data = pd.____(____)
# Return the DataFrame
return raw_data
raw_sales_data = extract("sales_data.parquet")