1. 학습
  2. /
  3. 강의
  4. /
  5. HR Analytics: Przewidywanie rotacji pracowników w Pythonie

Connected

연습 문제

Przycinanie drzewa

Przeuczenie (overfitting) to klasyczny problem w analityce, szczególnie w przypadku algorytmu drzewa decyzyjnego. W pełni wyrośnięte drzewo może dawać bardzo dokładne przewidywania dla zbioru treningowego, ale znacznie gorsze dla zbioru testowego. Dlatego wzrost drzewa decyzyjnego jest zazwyczaj kontrolowany przez:

  • „Przycinanie" drzewa i ograniczanie maksymalnej głębokości, do jakiej może rosnąć.
  • Ograniczanie minimalnej liczby obserwacji w jednym liściu drzewa.

W tym ćwiczeniu:

  • przytniesz drzewo i ograniczysz jego wzrost do 5 poziomów głębokości,
  • dopasujesz je do danych pracowniczych,
  • przetestujesz wyniki przewidywań na zbiorach treningowym i testowym.

Zmienne features_train, target_train, features_test i target_test są już dostępne w twoim środowisku pracy.

지침

100 XP
  • Zainicjalizuj DecisionTreeClassifier, ograniczając głębokość drzewa do 5.
  • Dopasuj model drzewa decyzyjnego, używając cech (features) i zmiennej docelowej (target) ze zbioru treningowego.
  • Sprawdź dokładność przewidywań na obu zbiorach – treningowym i testowym.