Regressão logística vs. árvore de classificação
Uma árvore de classificação divide o espaço de recursos em regiões retangulares. Por outro lado, um modelo linear, como a regressão logística, produz apenas um único limite de decisão linear, dividindo o espaço de recursos em duas regiões de decisão.
Escrevemos uma função personalizada chamada plot_labeled_decision_regions()
que você pode usar para traçar as regiões de decisão de uma lista contendo dois classificadores treinados. Você pode digitar help(plot_labeled_decision_regions)
no shell para saber mais sobre essa função.
X_train
, X_test
, y_train
, y_test
, o modelo dt
que você treinou em um exercício anterior, bem como a função plot_labeled_decision_regions()
estão disponíveis no seu espaço de trabalho.
Este exercício faz parte do curso
Aprendizado de máquina com modelos baseados em árvores em Python
Instruções do exercício
Importe
LogisticRegression
desklearn.linear_model
.Instancie um modelo
LogisticRegression
e atribua-o alogreg
.Ajuste
logreg
ao conjunto de treinamento.Analise o gráfico gerado por
plot_labeled_decision_regions()
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import LogisticRegression from sklearn.linear_model
from ____.____ import ____
# Instatiate logreg
____ = ____(random_state=1)
# Fit logreg to the training set
____.____(____, ____)
# Define a list called clfs containing the two classifiers logreg and dt
clfs = [logreg, dt]
# Review the decision regions of the two classifiers
plot_labeled_decision_regions(X_test, y_test, clfs)