CommencerCommencer gratuitement

Réaliser une agrégation

Après quelques missions de conseil pour une bibliothèque et un vendeur d’e-books, vous décrochez enfin votre premier grand projet de market basket analysis : accompagner une boutique en ligne de cadeaux insolites sur ses campagnes de ventes croisées. Comme le détaillant n’a encore jamais travaillé avec un data scientist, il souhaite que vous commenciez par explorer ses données de transactions. Il vous demande d’agréger toutes les lignes correspondant aux signs dans l’ensemble de données et de calculer le support pour cette catégorie. Notez que pandas a été importé sous le nom pd. De plus, les données ont été importées au format one-hot encodé sous le nom onehot.

Cet exercice fait partie du cours

Analyse des paniers d’achat en Python

Afficher le cours

Instructions

  • Sélectionnez le sous-ensemble de colonnes du DataFrame qui contient la chaîne sign.
  • Affichez le support pour les signs.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Select the column headers for sign items
sign_headers = [i for i in onehot.columns if i.lower().find('sign')>=0]

# Select columns of sign items using sign_headers
sign_columns = onehot[____]

# Perform aggregation of sign items into sign category
signs = sign_columns.sum(axis = 1) >= 1.0

# Print support for signs
print('Share of Signs: %.2f' % ____.mean())
Modifier et exécuter le code