Aan de slagGa gratis aan de slag

Informatiewinst van kleur berekenen

Nu je de entropieën van de wortel- en kindknooppunten kent, kun je de informatiewinst berekenen die kleur oplevert.

In de vorige oefeningen heb je entropy_root, entropy_left en entropy_right berekend. Ze zijn beschikbaar in de console.

Onthoud dat je het gewogen gemiddelde van de entropieën van de kindknooppunten neemt. Je moet dus berekenen welk deel van de oorspronkelijke observaties aan de linker- en rechterkant van de splitsing is terechtgekomen. Sla die respectievelijk op in p_left en p_right.

decison tree split by color

Deze oefening maakt deel uit van de cursus

Dimensionality Reduction in R

Cursus bekijken

Oefeninstructies

  • Bereken de wegingen van de splitsing — dus het aandeel observaties aan elke kant van de splitsing.
  • Bereken de informatiewinst met behulp van de wegingen en de entropieën.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Calculate the split weights
p_left <- ___/12
p_right <- ___/___

# Calculate the information gain
info_gain <- ___ - 
  (___ * entropy_left +
  p_right * ___)

info_gain
Code bewerken en uitvoeren