CommencerCommencer gratuitement

Définir la variable cible

Ici, vous allez construire un tableau croisé pandas avec les clients en lignes, les mois de facturation en colonnes, et le nombre de factures en valeurs. Vous utiliserez la valeur du dernier mois comme variable cible. Les autres variables peuvent servir de fonctionnalités retardées (lagged features) dans le modèle. Vous ne les utiliserez pas ici, mais nous vous encourageons vivement à vérifier si leur ajout améliore les performances de votre modèle au-delà de ce que vous verrez dans les prochains exercices.

Les bibliothèques pandas et numpy ont été chargées sous les alias pd et np respectivement. Le jeu de données online a été importé pour vous.

Cet exercice fait partie du cours

Machine Learning pour le marketing en Python

Afficher le cours

Instructions

  • Construisez un tableau croisé en utilisant la fonction pivot_table() pour compter les factures.
  • Enregistrez le nom de la colonne des ventes de novembre 2011 sous forme de liste.
  • Stockez la variable cible dans Y.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Build a pivot table counting invoices for each customer monthly
cust_month_tx = pd.___(data=online, values='___',
                               index=['___'], columns=['___'],
                               aggfunc=pd.Series.nunique, fill_value=0)

# Store November 2011 data column name as a list
target = ['2011-___']

# Store target value as `Y`
Y = cust_month_tx[___]
Modifier et exécuter le code