1. 학습
  2. /
  3. 강의
  4. /
  5. Uczenie maszynowe z modelami drzewiastymi w Pythonie

Connected

연습 문제

Wytrenuj swoje pierwsze drzewo klasyfikacyjne

W tym ćwiczeniu będziesz pracować z Wisconsin Breast Cancer Dataset z repozytorium UCI. Twoim zadaniem będzie przewidzenie, czy guz jest złośliwy, czy łagodny, na podstawie dwóch cech: średniego promienia guza (radius_mean) oraz średniej liczby wklęsłych punktów (concave points_mean).

Zbiór danych jest już wczytany do twojego środowiska i podzielony na 80% danych treningowych i 20% testowych. Macierze cech są przypisane do zmiennych X_train i X_test, natomiast tablice etykiet – do y_train i y_test, gdzie klasa 1 odpowiada guzowi złośliwemu, a klasa 0 – guzowi łagodnemu. Aby zapewnić powtarzalność wyników, zdefiniowano również zmienną SEED o wartości 1.

지침

100 XP
  • Zaimportuj DecisionTreeClassifier z modułu sklearn.tree.

  • Utwórz instancję DecisionTreeClassifier o nazwie dt z maksymalną głębokością równą 6.

  • Dopasuj dt do zbioru treningowego.

  • Przewidź etykiety zbioru testowego i przypisz wynik do zmiennej y_pred.