1. Nauka
  2. /
  3. Kursy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

ćwiczenie

Drzewa decyzyjne

Twoim zadaniem w tym ćwiczeniu jest zbudowanie prostego drzewa decyzyjnego przy użyciu klasy DecisionTreeClassifier z biblioteki scikit-learn na zbiorze danych breast cancer, który jest dostarczany razem z scikit-learn.

Zbiór ten zawiera numeryczne pomiary różnych cech poszczególnych guzów (takich jak obwód i tekstura) uzyskanych z biopsji piersi oraz jedną wartość docelową (guz jest złośliwy lub łagodny).

Zbiór próbek (pomiarów) został wczytany do X, a wartości docelowe dla każdego guza – do y. Teraz musisz podzielić cały zbiór danych na zbiory treningowy i testowy, a następnie wytrenować DecisionTreeClassifier. Określisz parametr o nazwie max_depth. W tym modelu można modyfikować wiele innych parametrów – wszystkie znajdziesz tutaj.

Instrukcje

100 XP
  • Zaimportuj:
    • train_test_split z sklearn.model_selection.
    • DecisionTreeClassifier z sklearn.tree.
  • Utwórz zbiory treningowy i testowy tak, aby 20% danych zostało użyte do testowania. Ustaw random_state na 123.
  • Utwórz instancję DecisionTreeClassifier o nazwie dt_clf_4 z max_depth równym 4. Ten parametr określa maksymalną liczbę kolejnych punktów podziału, jaką można mieć przed dotarciem do węzła liścia.
  • Dopasuj klasyfikator do zbioru treningowego i przewidź etykiety zbioru testowego.