Allena il tuo primo albero di classificazione
In questo esercizio lavorerai con il Wisconsin Breast Cancer Dataset dall'UCI Machine Learning Repository. Prevedrai se un tumore è maligno o benigno in base a due feature: il raggio medio del tumore (radius_mean) e il numero medio di punti concavi (concave points_mean).
Il dataset è già caricato nel tuo workspace ed è suddiviso in 80% train e 20% test. Le matrici delle feature sono assegnate a X_train e X_test, mentre gli array delle etichette sono assegnati a y_train e y_test, dove la classe 1 corrisponde a un tumore maligno e la classe 0 a un tumore benigno. Per ottenere risultati riproducibili, abbiamo anche definito una variabile chiamata SEED impostata a 1.
Questo esercizio fa parte del corso
Machine Learning con modelli ad alberi in Python
Istruzioni dell'esercizio
Importa
DecisionTreeClassifierdasklearn.tree.Istanzia un
DecisionTreeClassifierdtcon profondità massima pari a 6.Adatta
dtal training set.Prevedi le etichette del test set e assegna il risultato a
y_pred.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import DecisionTreeClassifier from sklearn.tree
from ____.____ import ____
# Instantiate a DecisionTreeClassifier 'dt' with a maximum depth of 6
dt = ____(____=____, random_state=SEED)
# Fit dt to the training set
____.____(____, ____)
# Predict test set labels
y_pred = ____.____(____)
print(y_pred[0:5])