Um segundo modelo simples
Neste exercício, você vai construir outro classificador usando regressão logística em um conjunto de dados de imagens. Cada imagem representa um número de 0 a 9. O objetivo é classificar cada imagem como um número — por exemplo, 7 ou 9. As features usadas são valores específicos de pixels que variam de 0 a 16 e compõem a imagem. Em vez de avaliar a acurácia manualmente, você vai avaliar a acurácia do modelo usando accuracy_score() do sklearn.
Os dados de exemplo de imagens são carregados como image_data, juntamente com sklearn e pandas como pd. LogisticRegression está disponível em sklearn.linear_model.
Este exercício faz parte do curso
Prevendo CTR com Machine Learning em Python
Instruções do exercício
- Obtenha a contagem de linhas de
Xpara determinar o índice no qual dividir os dados de treino e teste. - Crie um classificador de regressão logística.
- Gere previsões usando o classificador e avalie a acurácia com
accuracy_score()desklearn.metrics.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Define X and y
X = image_data.data
y = image_data.target
# Define training and testing
split = int(0.7 * ____(X))
X_train, X_test, y_train, y_test = \
X[:split], X[split:], y[:split], y[split:]
# Create logistic regression classifier
clf = ____()
# Train classifier - predict label and evaluate accuracy
y_pred = clf.fit(X_train, y_train).____(X_test)
print(____(y_test, y_pred))