Gini-index berekenen
Het decision tree-algoritme streeft naar terminale knopen die zo zuiver mogelijk zijn. De Gini-index is een van de methoden om dit te bereiken. Hij wordt berekend op basis van het aandeel van de steekproeven in elke groep.
Gegeven het aantal mensen dat respectievelijk is gebleven en vertrokken, bereken je de Gini-index voor die knoop.
Deze oefening maakt deel uit van de cursus
HR-analytics: verloop van medewerkers voorspellen in Python
Oefeninstructies
- Bereken het totale aantal medewerkers in die knoop.
- Bereken de Gini-index op basis van het aandeel medewerkers in elke groep.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
#number of people who stayed/left
stayed = 37
left = 1138
#sum of stayed and left
total = ____ + ____
#gini index
gini = ____*(____/total)*(____/total)