Hoher Bias oder hohe Varianz?
In dieser Übung findest du heraus, ob der Regressionsbaum dt, den du in der vorherigen Übung trainiert hast, unter einem Bias- oder einem Varianzproblem leidet.
Der RMSE auf dem Trainingssatz (RMSE_train) und der CV-RMSE (RMSE_CV), die dt erreicht hat, stehen in deinem Workspace bereit. Zusätzlich haben wir eine Variable namens baseline_RMSE geladen. Sie entspricht dem Root-Mean-Squared-Error des Regressionsbaums, der nur mit dem Feature disp trainiert wurde (das ist der RMSE des Regressionsbaums aus Kapitel 1, Lektion 3). Hier dient baseline_RMSE als Referenzwert: Liegt der RMSE eines Modells darüber, gilt es als underfittet; liegt er darunter, ist das Modell „gut genug“.
Leidet dt unter hohem Bias oder hoher Varianz?
Diese Übung ist Teil des Kurses
<Kurs>Maschinelles Lernen mit baumbasierten Modellen in Python</Kurs>Interaktive praktische Übung
Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis
Übung starten