1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z modelami drzewiastymi w Pythonie

Connected

ćwiczenie

Wysokie odchylenie czy wysoka wariancja?

W tym ćwiczeniu zdiagnozujesz, czy drzewo regresji dt wytrenowane w poprzednim ćwiczeniu ma problem z wysokim odchyleniem, czy z wysoką wariancją.

W twoim środowisku dostępne są: RMSE na zbiorze treningowym (RMSE_train) oraz RMSE na zbiorze walidacji krzyżowej (RMSE_CV) osiągnięte przez dt. Ponadto załadowana została zmienna baseline_RMSE, która odpowiada błędowi średniokwadratowemu drzewa regresji wytrenowanego wyłącznie na cesze disp (czyli RMSE uzyskanemu przez drzewo regresji z rozdziału 1, lekcji 3). Tutaj baseline_RMSE pełni rolę wartości bazowej: model, który ją przekracza, uznawany jest za niedouczony, natomiast model, który osiąga wynik poniżej niej, jest uznawany za wystarczająco dobry.

Czy dt zmaga się z problemem wysokiego odchylenia, czy wysokiej wariancji?

Instrukcje

50 XP

Możliwe odpowiedzi