LoslegenKostenlos starten

Informationsgewinn der Farbe berechnen

Jetzt, da du die Entropien des Wurzel- und der Kindknoten kennst, kannst du den Informationsgewinn berechnen, den die Farbe liefert.

In den vorherigen Aufgaben hast du entropy_root, entropy_left und entropy_right berechnet. Sie stehen dir in der Konsole zur Verfügung.

Denk daran: Du bildest den gewichteten Durchschnitt der Entropien der Kindknoten. Dafür musst du berechnen, welcher Anteil der ursprünglichen Beobachtungen auf der linken bzw. rechten Seite des Splits gelandet ist. Speichere diese Anteile in p_left bzw. p_right.

decison tree split by color

Diese Übung ist Teil des Kurses

<Kurs>Dimensionsreduktion in R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Berechne die Split-Gewichte – also den Anteil der Beobachtungen auf jeder Seite des Splits.
  • Berechne den Informationsgewinn mithilfe der Gewichte und der Entropien.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Calculate the split weights
p_left <- ___/12
p_right <- ___/___

# Calculate the information gain
info_gain <- ___ - 
  (___ * entropy_left +
  p_right * ___)

info_gain
Code bearbeiten und ausführen