Transformer les données de vente avec pandas
Avant de pouvoir extraire des informations d'un ensemble de données, il peut être nécessaire de modifier les types de colonnes pour exploiter correctement les données. Cette situation est particulièrement fréquente avec les types de données temporelles, qui peuvent être stockées de différentes manières.
Pour cet exemple, pandas
a été importé en tant que pd
et est prêt à être utilisé.
Cet exercice fait partie du cours
ETL et ELT en Python
Instructions
- Mettez à jour la fonction
transform()
pour convertir les données de la colonne"Order Date"
au typedatetime
. - Filtrez la DataFrame pour qu'elle ne contienne que les lignes dont l'adresse
"Price Each"
est inférieure à dix dollars. - Imprimez les types de données de chaque colonne du DataFrame.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
raw_sales_data = extract("sales_data.csv")
def transform(raw_data):
# Convert the "Order Date" column to type datetime
raw_data["Order Date"] = pd.____(____, format="%m/%d/%y %H:%M")
# Only keep items under ten dollars
clean_data = raw_data.loc[____, :]
return clean_data
clean_sales_data = transform(raw_sales_data)
# Check the data types of each column
print(____)