CommencerCommencer gratuitement

Transformer les données de vente avec pandas

Avant de pouvoir extraire des informations d'un ensemble de données, il peut être nécessaire de modifier les types de colonnes pour exploiter correctement les données. Cette situation est particulièrement fréquente avec les types de données temporelles, qui peuvent être stockées de différentes manières.

Pour cet exemple, pandas a été importé en tant que pd et est prêt à être utilisé.

Cet exercice fait partie du cours

ETL et ELT en Python

Afficher le cours

Instructions

  • Mettez à jour la fonction transform() pour convertir les données de la colonne "Order Date" au type datetime.
  • Filtrez la DataFrame pour qu'elle ne contienne que les lignes dont l'adresse "Price Each" est inférieure à dix dollars.
  • Imprimez les types de données de chaque colonne du DataFrame.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

raw_sales_data = extract("sales_data.csv")

def transform(raw_data):
    # Convert the "Order Date" column to type datetime
    raw_data["Order Date"] = pd.____(____, format="%m/%d/%y %H:%M")
    
    # Only keep items under ten dollars
    clean_data = raw_data.loc[____, :]
    return clean_data

clean_sales_data = transform(raw_sales_data)

# Check the data types of each column
print(____)
Modifier et exécuter le code