Dopasowanie drzewa decyzyjnego

Lasy losowe to jeden z najchętniej stosowanych modeli predykcyjnych – działają dobrze od razu po wyjęciu z pudełka. Najpierw jednak poznamy ich podstawowy budulec, czyli drzewa decyzyjne.

Drzewa decyzyjne dzielą dane na grupy na podstawie cech. Podział zaczyna się od węzła głównego i trwa aż do osiągnięcia węzłów liściowych.

decision tree

Do dopasowania drzewa decyzyjnego możesz użyć biblioteki sklearn – skorzystaj z klasy DecisionTreeRegressor i metody .fit(features, targets).

Jeśli nie ograniczysz głębokości drzewa, będzie ono dzielić dane tak długo, aż każdy liść będzie zawierał dokładnie jedną próbkę. To klasyczny przykład przeuczenia (overfitting). Więcej na ten temat dowiesz się w kolejnych rozdziałach.

Użyj zaimportowanej klasy DecisionTreeRegressor z domyślnymi argumentami (tzn. bez żadnych argumentów), aby utworzyć model drzewa decyzyjnego o nazwie decision_tree.
Dopasuj model, korzystając z train_features i train_targets – zmiennych utworzonych wcześniej, zawierających cechy dotyczące dnia tygodnia i wolumenu.
Wyświetl wynik (score) dla zbioru treningowego (train_features i train_targets), a także dla zbioru testowego (test_features i test_targets).

ćwiczenie

Dopasowanie drzewa decyzyjnego

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie