CommencerCommencez gratuitement

Extraction manuelle de caractéristiques I

Vous souhaitez comparer les prix de produits spécifiques entre des magasins. Les variables du jeu de données préchargé sales_df sont : storeID, product, quantity et revenue. Les variables quantity et revenue indiquent combien d’unités d’un produit donné ont été vendues dans un magasin et quel a été le chiffre d’affaires total. Pour votre analyse, il est plus intéressant de connaître le prix moyen par produit.

Cet exercice fait partie du cours

<cours>Réduction de dimension en Python</cours>
Voir le cours

Instructions de l’exercice

  • Calculez le prix du produit à partir de la quantité vendue et du chiffre d’affaires total.
  • Supprimez les variables quantity et revenue du jeu de données.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Calculate the price from the quantity sold and revenue
sales_df['price'] = ____

# Drop the quantity and revenue features
reduced_df = sales_df.drop(____, axis=1)

print(reduced_df.head())
Modifier et exécuter le code