LoslegenKostenlos loslegen

Hohe Verzerrung oder hohe Varianz?

In dieser Übung diagnostizierst du, ob der Regressionsbaum dt, den du in der vorherigen Übung trainiert hast, unter einer Verzerrung oder einem Varianzproblem leidet.

Das Trainingsset RMSE (RMSE_train) und das von dt erreichte CV RMSE (RMSE_CV) sind in deinem Arbeitsbereich verfügbar. Außerdem haben wir eine Variable namens baseline_RMSE geladen, die dem mittleren quadratischen Fehler des Regressionsbaums entspricht, der nur mit dem Merkmal disp trainiert wurde (es ist der RMSE, der von dem in Kapitel 1, Lektion 3 trainierten Regressionsbaum erreicht wurde). Hier dient baseline_RMSE als Basiswert RMSE, bei dessen Überschreitung ein Modell als unzureichend angepasst und bei dessen Unterschreitung das Modell als "gut genug" angesehen wird.

Hat dt ein Problem mit einer hohen Verzerrung oder einer hohen Varianz?

Diese Übung ist Teil des Kurses

Maschinelles Lernen mit baumbasierten Modellen in Python

Kurs anzeigen

Interaktive Übung

In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.

Übung starten