Informationsgewinn der Farbe berechnen

Jetzt, da du die Entropien des Wurzel- und der Kindknoten kennst, kannst du den Informationsgewinn berechnen, den die Farbe liefert.

In den vorherigen Aufgaben hast du entropy_root, entropy_left und entropy_right berechnet. Sie stehen dir in der Konsole zur Verfügung.

Denk daran: Du bildest den gewichteten Durchschnitt der Entropien der Kindknoten. Dafür musst du berechnen, welcher Anteil der ursprünglichen Beobachtungen auf der linken bzw. rechten Seite des Splits gelandet ist. Speichere diese Anteile in p_left bzw. p_right.

decison tree split by color

Diese Übung ist Teil des Kurses

Dimensionsreduktion in R

Kurs anzeigen

Anleitung zur Übung

Berechne die Split-Gewichte – also den Anteil der Beobachtungen auf jeder Seite des Splits.
Berechne den Informationsgewinn mithilfe der Gewichte und der Entropien.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Calculate the split weights
p_left <- ___/12
p_right <- ___/___

# Calculate the information gain
info_gain <- ___ - 
  (___ * entropy_left +
  p_right * ___)

info_gain

Code bearbeiten und ausführen