ComenzarEmpieza gratis

Calcular la ganancia de información del color

Ahora que ya conoces las entropías del nodo raíz y de los nodos hijos, puedes calcular la ganancia de información que aporta el color.

En los ejercicios anteriores calculaste entropy_root, entropy_left y entropy_right. Están disponibles en la consola.

Recuerda que vas a tomar la media ponderada de las entropías de los nodos hijos. Por tanto, tendrás que calcular qué proporción de las observaciones originales terminó en el lado izquierdo y derecho del corte. Guarda esos valores en p_left y p_right, respectivamente.

decison tree split by color

Este ejercicio forma parte del curso

Reducción de la dimensionalidad en R

Ver curso

Instrucciones del ejercicio

  • Calcula los pesos del corte —es decir, la proporción de observaciones en cada lado del corte—.
  • Calcula la ganancia de información usando los pesos y las entropías.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Calculate the split weights
p_left <- ___/12
p_right <- ___/___

# Calculate the information gain
info_gain <- ___ - 
  (___ * entropy_left +
  p_right * ___)

info_gain
Editar y ejecutar código