Convalidare le trasformazioni dei dati
Ottimo lavoro finora! Verificare manualmente a campione le trasformazioni è un ottimo primo passo per assicurarti di mantenere la qualità dei dati lungo tutta la pipeline. pandas offre diverse funzioni integrate che ti aiutano proprio in questo!
Per iniziare con questo esercizio, pandas è già stato importato come pd.
Questo esercizio fa parte del corso
ETL and ELT in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
def extract(file_path):
# Ingest the data to a DataFrame
raw_data = pd.____(____)
# Return the DataFrame
return raw_data
raw_sales_data = extract("sales_data.parquet")