Calculer l’indice de Gini
L’algorithme des arbres de décision cherche à obtenir, dans les nœuds terminaux, des partitions aussi pures que possible. L’indice de Gini fait partie des méthodes utilisées pour cela. Il est calculé à partir de la proportion d’échantillons dans chaque groupe.
Étant donné le nombre de personnes restées et parties respectivement, calculez l’indice de Gini pour ce nœud.
Cet exercice fait partie du cours
Analytique RH : prédire l’attrition des employés en Python
Instructions
- Calculez le nombre total d’employés dans ce nœud.
- Calculez l’indice de Gini à partir de la proportion d’employés dans chaque groupe.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
#number of people who stayed/left
stayed = 37
left = 1138
#sum of stayed and left
total = ____ + ____
#gini index
gini = ____*(____/total)*(____/total)