Un deuxième modèle jouet
Dans cet exercice, vous allez construire un autre classifieur à l’aide d’une régression logistique sur un jeu de données d’images. Chaque image représente un chiffre de 0 à 9. L’objectif est de classer chaque image en tant que chiffre — par exemple, un 7 ou un 9. Les variables utilisées sont des valeurs de pixels spécifiques allant de 0 à 16 qui composent l’image. Au lieu d’évaluer la précision à la main, vous évaluerez la précision du modèle avec accuracy_score() de sklearn.
Des données d’images d’exemple sont chargées sous le nom image_data, ainsi que sklearn et pandas sous pd. LogisticRegression est disponible via sklearn.linear_model.
Cet exercice fait partie du cours
Prédire le CTR avec le Machine Learning en Python
Instructions
- Récupérez le nombre de lignes de
Xpour déterminer l’index auquel séparer les données d’entraînement et de test. - Créez un classifieur de régression logistique.
- Générez des prédictions avec le classifieur et évaluez la précision avec
accuracy_score()depuissklearn.metrics.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Define X and y
X = image_data.data
y = image_data.target
# Define training and testing
split = int(0.7 * ____(X))
X_train, X_test, y_train, y_test = \
X[:split], X[split:], y[:split], y[split:]
# Create logistic regression classifier
clf = ____()
# Train classifier - predict label and evaluate accuracy
y_pred = clf.fit(X_train, y_train).____(X_test)
print(____(y_test, y_pred))