Attribuer la cohorte d’acquisition quotidienne
Comme vous l’avez vu dans la vidéo, définir une cohorte est la première étape d’une analyse de cohortes. Vous allez maintenant créer des cohortes quotidiennes en fonction du jour de la première transaction de chaque client.
Les données ont été chargées dans un DataFrame online. Vous pouvez afficher ses premières lignes avec online.head() dans la console.
Cet exercice fait partie du cours
Customer Segmentation in Python
Instructions
- Créez une fonction prenant un objet datetime qui extrait l’année, le mois et le jour de
x. - Créez une colonne
InvoiceDayen partant de la colonneInvoiceDateet en appliquant la fonctionget_day. - Créez un objet
groupbyqui regroupe la variableCustomerID, puis sélectionneInvoiceDaypour les calculs ultérieurs. - Créez une colonne
CohortDayen sélectionnant la valeur minimale deInvoiceDay.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Define a function that will parse the date
def get_day(x): return dt.datetime(x.year, ____, ____)
# Create InvoiceDay column
online['____'] = online['____'].apply(____)
# Group by CustomerID and select the InvoiceDay value
grouping = online.groupby('____')['____']
# Assign a minimum InvoiceDay value to the dataset
online['CohortDay'] = grouping.____('____')
# View the top 5 rows
print(online.head())