Het model fitten en testen
In de vorige oefening heb je de gegevensset opgesplitst in X_train, X_test, y_train en y_test. Deze gegevenssets zijn alvast voor je ingeladen.
Je gaat nu een support vector machine-classificatiemodel (SVC()) maken en dit fitten op de trainingsdata.
Daarna bereken je de nauwkeurigheid op zowel de test- als de trainingsset om overfitting te detecteren.
Deze oefening maakt deel uit van de cursus
Dimensionality Reduction in Python
Oefeninstructies
- Importeer
SVCuitsklearn.svmenaccuracy_scoreuitsklearn.metrics. - Maak een instantie van de Support Vector Classification-klasse (
SVC()). - Fit het model op de trainingsdata.
- Bereken de accuracy-scores op zowel de train- als testdata.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import SVC from sklearn.svm and accuracy_score from sklearn.metrics
from ____ import ____
from ____ import ____
# Create an instance of the Support Vector Classification class
svc = ____
# Fit the model to the training data
svc.fit(____, ____)
# Calculate accuracy scores on both train and test data
accuracy_train = accuracy_score(____, svc.predict(____))
accuracy_test = accuracy_score(____, svc.predict(____))
print(f"{accuracy_test:.1%} accuracy on test set vs. {accuracy_train:.1%} on training set")