Calcular la ganancia de información del color
Ahora que ya conoces las entropías del nodo raíz y de los nodos hijos, puedes calcular la ganancia de información que aporta el color.
En los ejercicios anteriores calculaste entropy_root, entropy_left y entropy_right. Están disponibles en la consola.
Recuerda que vas a tomar la media ponderada de las entropías de los nodos hijos. Por tanto, tendrás que calcular qué proporción de las observaciones originales terminó en el lado izquierdo y derecho del corte. Guarda esos valores en p_left y p_right, respectivamente.

Este ejercicio forma parte del curso
Reducción de la dimensionalidad en R
Instrucciones del ejercicio
- Calcula los pesos del corte —es decir, la proporción de observaciones en cada lado del corte—.
- Calcula la ganancia de información usando los pesos y las entropías.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Calculate the split weights
p_left <- ___/12
p_right <- ___/___
# Calculate the information gain
info_gain <- ___ -
(___ * entropy_left +
p_right * ___)
info_gain