Treine sua primeira árvore de classificação

Neste exercício, você trabalhará com o Conjunto de Dados de Câncer de Mama de Wisconsin do repositório de aprendizado de máquina UCI. Você poderá prever se um tumor é maligno ou benigno com base em duas características: o raio médio do tumor (radius_mean) e seu número médio de pontos côncavos (concave points_mean).

O conjunto de dados já está carregado em seu espaço de trabalho e está dividido em 80% de treinamento e 20% de teste. As matrizes de recursos são atribuídas a X_train e X_test, enquanto as matrizes de rótulos são atribuídas a y_train e y_test, onde a classe 1 corresponde a um tumor maligno e a classe 0 corresponde a um tumor benigno. Para obter resultados reproduzíveis, também definimos uma variável chamada SEED, que é definida como 1.

Este exercício faz parte do curso

Aprendizado de máquina com modelos baseados em árvores em Python

Ver Curso

Instruções de exercício

  • Importe DecisionTreeClassifier de sklearn.tree.

  • Instancie um DecisionTreeClassifier dt com profundidade máxima igual a 6.

  • Ajuste dt ao conjunto de treinamento.

  • Preveja os rótulos do conjunto de teste e atribua o resultado a y_pred.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import DecisionTreeClassifier from sklearn.tree
from ____.____ import ____

# Instantiate a DecisionTreeClassifier 'dt' with a maximum depth of 6
dt = ____(____=____, random_state=SEED)

# Fit dt to the training set
____.____(____, ____)

# Predict test set labels
y_pred = ____.____(____)
print(y_pred[0:5])