Trasformare i dati di vendita con pandas
Prima di poter ricavare insight da un insieme di dati, potrebbe essere necessario modificare i tipi di colonna per sfruttare correttamente le informazioni. Questo è particolarmente comune con i tipi temporali, che possono essere salvati in diversi modi.
Per questo esempio, pandas è stato importato come pd ed è pronto per essere utilizzato.
Questo esercizio fa parte del corso
ETL and ELT in Python
Istruzioni dell'esercizio
- Aggiorna la funzione
transform()per convertire i dati nella colonna"Order Date"in tipodatetime. - Filtra il DataFrame per contenere solo le righe con
"Price Each"inferiore a dieci dollari. - Stampa i tipi di dato di ciascuna colonna del DataFrame.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
raw_sales_data = extract("sales_data.csv")
def transform(raw_data):
# Convert the "Order Date" column to type datetime
raw_data["Order Date"] = pd.____(____, format="%m/%d/%y %H:%M")
# Only keep items under ten dollars
clean_data = raw_data.loc[____, :]
return clean_data
clean_sales_data = transform(raw_sales_data)
# Check the data types of each column
print(____)