Calcular el índice Gini
El algoritmo de árboles de decisión busca obtener particiones en los nodos terminales que sean lo más puras posible. El índice Gini es uno de los métodos que se usan para lograrlo. Se calcula en función de la proporción de muestras en cada grupo.
Dado el número de personas que se quedaron y las que se fueron, respectivamente, calcula el índice Gini para ese nodo.
Este ejercicio forma parte del curso
Analítica de RR. HH.: Predicción de rotación de empleados en Python
Instrucciones del ejercicio
- Calcula el número total de empleados en ese nodo.
- Calcula el índice Gini según la proporción de empleados en cada grupo.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
#number of people who stayed/left
stayed = 37
left = 1138
#sum of stayed and left
total = ____ + ____
#gini index
gini = ____*(____/total)*(____/total)