Calculando o índice de Gini
O algoritmo de árvore de decisão busca obter partições nos nós terminais que sejam o mais puras possível. O índice de Gini é um dos métodos usados para isso. Ele é calculado com base na proporção de amostras em cada grupo.
Dado o número de pessoas que ficaram e que saíram, respectivamente, calcule o índice de Gini para esse nó.
Este exercício faz parte do curso
HR Analytics: prevendo rotatividade de funcionários em Python
Instruções do exercício
- Calcule o número total de colaboradores nesse nó.
- Calcule o índice de Gini com base na proporção de colaboradores em cada grupo.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
#number of people who stayed/left
stayed = 37
left = 1138
#sum of stayed and left
total = ____ + ____
#gini index
gini = ____*(____/total)*(____/total)