Aan de slagGa gratis aan de slag

Modellen regulariseren met Twitter-gegevens

Je werkt met Twitter-gegevens waarin klanten hun sentiment over luchtvaartmaatschappijen uiten. De X-matrix met features en de y-vector met labels zijn al voor je gemaakt. Daarnaast is de train-test-splitsing uitgevoerd. Je kunt dus direct werken met de arrays X_train, X_test, y_train en y_test.

Je traint zowel geregulariseerde als flexibelere modellen en evalueert ze met verschillende prestatiemaatstaven voor modellen.

Alle benodigde pakketten zijn al geïmporteerd.

Deze oefening maakt deel uit van de cursus

Sentimentanalyse in Python

Cursus bekijken

Oefeninstructies

  • Train twee logistieke regressies: één met een regularisatieparameter van 100 en één van 0,1.
  • Print de nauwkeurigheidsscores van beide modellen.
  • Print de confusion matrix van elk model.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Build a logistic regression with regularizarion parameter of 100
log_reg1 = ____.____
# Build a logistic regression with regularizarion parameter of 0.1
log_reg2 = ____.____

# Predict the labels for each model
y_predict1 = log_reg1.predict(X_test)
y_predict2 = log_reg2.predict(X_test)

# Print performance metrics for each model
print('Accuracy of model 1: ', ____(____, ____))
print('Accuracy of model 2: ', ____(___, ____))
print('Confusion matrix of model 1: \n' , ____(____, ____)/len(y_test))
print('Confusion matrix of model 2: \n', ____(____, ____)/len(y_test))
Code bewerken en uitvoeren