Aan de slagGa gratis aan de slag

Doelvariabele definiëren

Hier ga je een pandas-draaipunt (pivot table) bouwen met klanten als rijen, factuurmaanden als kolommen en het aantal facturen als waarden. Je gebruikt de waarde van de laatste maand als doelvariabele. De overige variabelen kun je in het model gebruiken als zogeheten lagfeatures. Je gaat ze hier niet gebruiken, maar het is sterk aan te raden om te testen of het toevoegen van deze variabelen de modelprestaties verbetert ten opzichte van wat je in de volgende oefeningen ziet.

De bibliotheken pandas en numpy zijn respectievelijk als pd en np geladen. De online-gegevensset is voor je geïmporteerd.

Deze oefening maakt deel uit van de cursus

Machine Learning voor marketing in Python

Cursus bekijken

Oefeninstructies

  • Bouw een draaitabel met de functie pivot_table() waarin je het aantal facturen telt.
  • Sla de kolomnaam van de verkoopgegevens van november 2011 op als een lijst.
  • Sla de doelwaarde op als Y.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Build a pivot table counting invoices for each customer monthly
cust_month_tx = pd.___(data=online, values='___',
                               index=['___'], columns=['___'],
                               aggfunc=pd.Series.nunique, fill_value=0)

# Store November 2011 data column name as a list
target = ['2011-___']

# Store target value as `Y`
Y = cust_month_tx[___]
Code bewerken en uitvoeren