Réaliser une agrégation
Après quelques missions de conseil pour une bibliothèque et un vendeur d’e-books, vous décrochez enfin votre premier grand projet de market basket analysis : accompagner une boutique en ligne de cadeaux insolites sur ses campagnes de ventes croisées. Comme le détaillant n’a encore jamais travaillé avec un data scientist, il souhaite que vous commenciez par explorer ses données de transactions. Il vous demande d’agréger toutes les lignes correspondant aux signs dans l’ensemble de données et de calculer le support pour cette catégorie. Notez que pandas a été importé sous le nom pd. De plus, les données ont été importées au format one-hot encodé sous le nom onehot.
Cet exercice fait partie du cours
Analyse des paniers d’achat en Python
Instructions
- Sélectionnez le sous-ensemble de colonnes du DataFrame qui contient la chaîne
sign. - Affichez le support pour les
signs.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Select the column headers for sign items
sign_headers = [i for i in onehot.columns if i.lower().find('sign')>=0]
# Select columns of sign items using sign_headers
sign_columns = onehot[____]
# Perform aggregation of sign items into sign category
signs = sign_columns.sum(axis = 1) >= 1.0
# Print support for signs
print('Share of Signs: %.2f' % ____.mean())