Modellen regulariseren met Twitter-gegevens

Je werkt met Twitter-gegevens waarin klanten hun sentiment over luchtvaartmaatschappijen uiten. De X-matrix met features en de y-vector met labels zijn al voor je gemaakt. Daarnaast is de train-test-splitsing uitgevoerd. Je kunt dus direct werken met de arrays X_train, X_test, y_train en y_test.

Je traint zowel geregulariseerde als flexibelere modellen en evalueert ze met verschillende prestatiemaatstaven voor modellen.

Alle benodigde pakketten zijn al geïmporteerd.

Deze oefening maakt deel uit van de cursus

Sentimentanalyse in Python

Bekijk cursus

Oefeninstructies

Train twee logistieke regressies: één met een regularisatieparameter van 100 en één van 0,1.
Print de nauwkeurigheidsscores van beide modellen.
Print de confusion matrix van elk model.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Build a logistic regression with regularizarion parameter of 100
log_reg1 = ____.____
# Build a logistic regression with regularizarion parameter of 0.1
log_reg2 = ____.____

# Predict the labels for each model
y_predict1 = log_reg1.predict(X_test)
y_predict2 = log_reg2.predict(X_test)

# Print performance metrics for each model
print('Accuracy of model 1: ', ____(____, ____))
print('Accuracy of model 2: ', ____(___, ____))
print('Confusion matrix of model 1: \n' , ____(____, ____)/len(y_test))
print('Confusion matrix of model 2: \n', ____(____, ____)/len(y_test))

Code bewerken en uitvoeren