IniziaInizia gratis

Allena il tuo primo albero di classificazione

In questo esercizio lavorerai con il Wisconsin Breast Cancer Dataset dall'UCI Machine Learning Repository. Prevedrai se un tumore è maligno o benigno in base a due feature: il raggio medio del tumore (radius_mean) e il numero medio di punti concavi (concave points_mean).

Il dataset è già caricato nel tuo workspace ed è suddiviso in 80% train e 20% test. Le matrici delle feature sono assegnate a X_train e X_test, mentre gli array delle etichette sono assegnati a y_train e y_test, dove la classe 1 corrisponde a un tumore maligno e la classe 0 a un tumore benigno. Per ottenere risultati riproducibili, abbiamo anche definito una variabile chiamata SEED impostata a 1.

Questo esercizio fa parte del corso

Machine Learning con modelli ad alberi in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa DecisionTreeClassifier da sklearn.tree.

  • Istanzia un DecisionTreeClassifier dt con profondità massima pari a 6.

  • Adatta dt al training set.

  • Prevedi le etichette del test set e assegna il risultato a y_pred.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import DecisionTreeClassifier from sklearn.tree
from ____.____ import ____

# Instantiate a DecisionTreeClassifier 'dt' with a maximum depth of 6
dt = ____(____=____, random_state=SEED)

# Fit dt to the training set
____.____(____, ____)

# Predict test set labels
y_pred = ____.____(____)
print(y_pred[0:5])
Modifica ed esegui il codice