Treine sua primeira árvore de classificação
Neste exercício, você trabalhará com o Conjunto de Dados de Câncer de Mama de Wisconsin do repositório de aprendizado de máquina UCI. Você poderá prever se um tumor é maligno ou benigno com base em duas características: o raio médio do tumor (radius_mean
) e seu número médio de pontos côncavos (concave points_mean
).
O conjunto de dados já está carregado em seu espaço de trabalho e está dividido em 80% de treinamento e 20% de teste. As matrizes de recursos são atribuídas a X_train
e X_test
, enquanto as matrizes de rótulos são atribuídas a y_train
e y_test
, onde a classe 1 corresponde a um tumor maligno e a classe 0 corresponde a um tumor benigno. Para obter resultados reproduzíveis, também definimos uma variável chamada SEED
, que é definida como 1.
Este exercício faz parte do curso
Aprendizado de máquina com modelos baseados em árvores em Python
Instruções de exercício
Importe
DecisionTreeClassifier
desklearn.tree
.Instancie um
DecisionTreeClassifier
dt
com profundidade máxima igual a 6.Ajuste
dt
ao conjunto de treinamento.Preveja os rótulos do conjunto de teste e atribua o resultado a
y_pred
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import DecisionTreeClassifier from sklearn.tree
from ____.____ import ____
# Instantiate a DecisionTreeClassifier 'dt' with a maximum depth of 6
dt = ____(____=____, random_state=SEED)
# Fit dt to the training set
____.____(____, ____)
# Predict test set labels
y_pred = ____.____(____)
print(y_pred[0:5])