Hohe Verzerrung oder hohe Varianz?
In dieser Übung diagnostizierst du, ob der Regressionsbaum dt
, den du in der vorherigen Übung trainiert hast, unter einer Verzerrung oder einem Varianzproblem leidet.
Das Trainingsset RMSE (RMSE_train
) und das von dt
erreichte CV RMSE (RMSE_CV
) sind in deinem Arbeitsbereich verfügbar. Außerdem haben wir eine Variable namens baseline_RMSE
geladen, die dem mittleren quadratischen Fehler des Regressionsbaums entspricht, der nur mit dem Merkmal disp
trainiert wurde (es ist der RMSE, der von dem in Kapitel 1, Lektion 3 trainierten Regressionsbaum erreicht wurde). Hier dient baseline_RMSE
als Basiswert RMSE, bei dessen Überschreitung ein Modell als unzureichend angepasst und bei dessen Unterschreitung das Modell als "gut genug" angesehen wird.
Hat dt
ein Problem mit einer hohen Verzerrung oder einer hohen Varianz?
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit baumbasierten Modellen in Python
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
