Ajuster et tester le modèle
Dans l’exercice précédent, vous avez séparé le jeu de données en X_train, X_test, y_train et y_test. Ces jeux de données ont été préchargés pour vous.
Vous allez maintenant créer un classificateur à vecteurs de support (SVC()) et l’ajuster sur les données d’entraînement.
Vous calculerez ensuite la précision à la fois sur les ensembles de test et d’entraînement pour détecter un surapprentissage.
Cet exercice fait partie du cours
Réduction de dimension en Python
Instructions
- Importez
SVCdepuissklearn.svmetaccuracy_scoredepuissklearn.metrics. - Créez une instance de la classe Support Vector Classification (
SVC()). - Ajustez le modèle sur les données d’entraînement.
- Calculez les scores de précision sur les données d’entraînement et de test.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import SVC from sklearn.svm and accuracy_score from sklearn.metrics
from ____ import ____
from ____ import ____
# Create an instance of the Support Vector Classification class
svc = ____
# Fit the model to the training data
svc.fit(____, ____)
# Calculate accuracy scores on both train and test data
accuracy_train = accuracy_score(____, svc.predict(____))
accuracy_test = accuracy_score(____, svc.predict(____))
print(f"{accuracy_test:.1%} accuracy on test set vs. {accuracy_train:.1%} on training set")