Transformaties van data valideren
Goed bezig tot nu toe! Handmatig steekproefsgewijs transformaties controleren is een goede eerste stap om te zorgen dat je de datakwaliteit in de hele pijplijn bewaakt. pandas biedt verschillende ingebouwde functies die je daarbij helpen!
Om je op weg te helpen in deze oefening is pandas al geïmporteerd als pd.
Deze oefening maakt deel uit van de cursus
ETL en ELT in Python
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
def extract(file_path):
# Ingest the data to a DataFrame
raw_data = pd.____(____)
# Return the DataFrame
return raw_data
raw_sales_data = extract("sales_data.parquet")