1. Learn
  2. /
  3. Cursuri
  4. /
  5. Machine Learning cu modele bazate pe arbori în Python

Connected

exercițiu

Antrenează primul tău arbore de clasificare

În acest exercițiu vei lucra cu Wisconsin Breast Cancer Dataset din depozitul de machine learning al UCI. Vei prezice dacă o tumoare este malignă sau benignă pe baza a două caracteristici: raza medie a tumorii (radius_mean) și numărul mediu de puncte concave (concave points_mean).

Setul de date este deja încărcat în spațiul tău de lucru și este împărțit în 80% antrenament și 20% testare. Matricele de caracteristici sunt atribuite variabilelor X_train și X_test, iar vectorii de etichete sunt atribuiți variabilelor y_train și y_test, unde clasa 1 corespunde unei tumori maligne, iar clasa 0 corespunde unei tumori benigne. Pentru a obține rezultate reproductibile, am definit și o variabilă numită SEED, cu valoarea 1.

Instrucțiuni

100 XP
  • Importă DecisionTreeClassifier din sklearn.tree.

  • Instanțiază un DecisionTreeClassifier numit dt cu adâncimea maximă egală cu 6.

  • Antrenează dt pe setul de antrenament.

  • Prezice etichetele setului de testare și atribuie rezultatul variabilei y_pred.