Handmatige feature-extractie I
Je wilt prijzen van specifieke producten tussen winkels vergelijken. De features in de vooringeladen gegevensset sales_df zijn: storeID, product, quantity en revenue. De features quantity en revenue vertellen je hoeveel items van een bepaald product in een winkel zijn verkocht en wat de totale omzet was. Voor je analyse is het interessanter om de gemiddelde prijs per product te weten.
Deze oefening maakt deel uit van de cursus
Dimensionality Reduction in Python
Oefeninstructies
- Bereken de productprijs op basis van de verkochte hoeveelheid en de totale omzet.
- Verwijder de features quantity en revenue uit de gegevensset.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Calculate the price from the quantity sold and revenue
sales_df['price'] = ____
# Drop the quantity and revenue features
reduced_df = sales_df.drop(____, axis=1)
print(reduced_df.head())