Extraction manuelle de caractéristiques I
Vous souhaitez comparer les prix de produits spécifiques entre des magasins. Les variables du jeu de données préchargé sales_df sont : storeID, product, quantity et revenue. Les variables quantity et revenue indiquent combien d’unités d’un produit donné ont été vendues dans un magasin et quel a été le chiffre d’affaires total. Pour votre analyse, il est plus intéressant de connaître le prix moyen par produit.
Cet exercice fait partie du cours
Réduction de dimension en Python
Instructions
- Calculez le prix du produit à partir de la quantité vendue et du chiffre d’affaires total.
- Supprimez les variables quantity et revenue du jeu de données.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the price from the quantity sold and revenue
sales_df['price'] = ____
# Drop the quantity and revenue features
reduced_df = sales_df.drop(____, axis=1)
print(reduced_df.head())