Extraction manuelle de caractéristiques I
Vous souhaitez comparer les prix de produits spécifiques entre des magasins. Les variables du jeu de données préchargé sales_df sont : storeID, product, quantity et revenue. Les variables quantity et revenue indiquent combien d’unités d’un produit donné ont été vendues dans un magasin et quel a été le chiffre d’affaires total. Pour votre analyse, il est plus intéressant de connaître le prix moyen par produit.
Cet exercice fait partie du cours
<cours>Réduction de dimension en Python</cours>Instructions de l’exercice
- Calculez le prix du produit à partir de la quantité vendue et du chiffre d’affaires total.
- Supprimez les variables quantity et revenue du jeu de données.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Calculate the price from the quantity sold and revenue
sales_df['price'] = ____
# Drop the quantity and revenue features
reduced_df = sales_df.drop(____, axis=1)
print(reduced_df.head())