Het model fitten en testen

In de vorige oefening heb je de gegevensset opgesplitst in X_train, X_test, y_train en y_test. Deze gegevenssets zijn alvast voor je ingeladen. Je gaat nu een support vector machine-classificatiemodel (SVC()) maken en dit fitten op de trainingsdata. Daarna bereken je de nauwkeurigheid op zowel de test- als de trainingsset om overfitting te detecteren.

Deze oefening maakt deel uit van de cursus

Dimensionality Reduction in Python

Bekijk cursus

Oefeninstructies

Importeer SVC uit sklearn.svm en accuracy_score uit sklearn.metrics.
Maak een instantie van de Support Vector Classification-klasse (SVC()).
Fit het model op de trainingsdata.
Bereken de accuracy-scores op zowel de train- als testdata.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import SVC from sklearn.svm and accuracy_score from sklearn.metrics
from ____ import ____
from ____ import ____

# Create an instance of the Support Vector Classification class
svc = ____

# Fit the model to the training data
svc.fit(____, ____)

# Calculate accuracy scores on both train and test data
accuracy_train = accuracy_score(____, svc.predict(____))
accuracy_test = accuracy_score(____, svc.predict(____))

print(f"{accuracy_test:.1%} accuracy on test set vs. {accuracy_train:.1%} on training set")

Code bewerken en uitvoeren