Calculando o ganho de informação da cor
Agora que você sabe as entropias do nó raiz e dos nós filhos, pode calcular o ganho de informação que a cor fornece.
Nos exercícios anteriores, você calculou entropy_root, entropy_left e entropy_right. Eles estão disponíveis no console.
Lembre-se de que você vai calcular a média ponderada das entropias dos nós filhos. Então, será preciso calcular qual proporção das observações originais foi para o lado esquerdo e para o lado direito da divisão. Armazene essas proporções em p_left e p_right, respectivamente.

Este exercício faz parte do curso
Redução de Dimensionalidade em R
Instruções do exercício
- Calcule os pesos da divisão — isto é, a proporção de observações em cada lado da divisão.
- Calcule o ganho de informação usando os pesos e as entropias.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate the split weights
p_left <- ___/12
p_right <- ___/___
# Calculate the information gain
info_gain <- ___ -
(___ * entropy_left +
p_right * ___)
info_gain