Interacties toevoegen aan de basistabel
Stel dat een non-profitorganisatie een campagne wil lanceren in Spanje en Frankrijk, en wil weten welke donateurs het meest geneigd zijn te geven. Gegeven is een basetable met predictieve variabelen "age", "country_Spain", "country_France" en het doel "target".
Voor je gemak is een functie auc geïmplementeerd die de AUC retourneert op gepartitioneerde data. De functie neemt twee argumenten: de set beschouwde variabelen en de basistabel:
auc(["variable_1","variable_2"], basetable)
0.51
In deze oefening leer je hoe je interacties toevoegt aan de basistabel en controleert of dit de AUC van het predictieve model verbetert.
Deze oefening maakt deel uit van de cursus
Gevorderde voorspellende analyse in Python
Oefeninstructies
- Print de AUC van een model dat alleen
agegebruikt en de AUC van een model dat alleencountry_Spaingebruikt. - Print de AUC van een model dat
ageencountry_Spaingebruikt. - Voeg twee interactietermen toe aan de basistabel:
agemetcountry_Spainenagemetcountry_France. - Print de AUC van een model dat
age,country_Spainen de interactietermen gebruikt.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Calculate AUC using age only
print(auc(["____"], basetable))
# Calculate AUC using country_Spain only
print(____(["____"], ____))
# Calculate AUC using age and country_Spain
print(____(["____", "____"], ____))
# Add interactions country_Spain x age and country_France x age
basetable["spain_age"] = ____["____"] * ____["____"]
basetable["france_age"] = ____["____"] * ____["____"]
# Calculate AUC using age, country_Spain and interactions
print(____(["____", "____", "____", "____"], ____))