Calcolo dell'indice di Gini
L'algoritmo dell'albero decisionale punta a ottenere partizioni nei nodi terminali il più pure possibile. L'indice di Gini è uno dei metodi usati a questo scopo. Si calcola in base alla proporzione di campioni in ciascun gruppo.
Dato il numero di persone che sono rimaste e che hanno lasciato, calcola l'indice di Gini per quel nodo.
Questo esercizio fa parte del corso
HR Analytics: prevedere l'abbandono dei dipendenti in Python
Istruzioni dell'esercizio
- Calcola il numero totale di dipendenti in quel nodo.
- Calcola l'indice di Gini in base alla proporzione di dipendenti in ciascun gruppo.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
#number of people who stayed/left
stayed = 37
left = 1138
#sum of stayed and left
total = ____ + ____
#gini index
gini = ____*(____/total)*(____/total)