Régulariser des modèles avec des données Twitter

Vous allez travailler sur des tweets exprimant le sentiment de clients à propos de compagnies aériennes. La matrice de caractéristiques X et le vecteur d’étiquettes y ont été préparés pour vous. De plus, la séparation entraînement/test a déjà été effectuée. Vous pouvez donc utiliser directement les tableaux X_train, X_test, y_train et y_test.

Vous allez entraîner des modèles régularisés et des modèles plus flexibles, puis les évaluer avec différentes métriques de performance.

Tous les packages nécessaires ont été importés pour vous.

Cet exercice fait partie du cours

Analyse de sentiments en Python

Afficher le cours

Instructions

Entraînez deux régressions logistiques : l’une avec un paramètre de régularisation égal à 100 et l’autre égal à 0,1.
Affichez les scores d’accuracy de chaque modèle.
Affichez la matrice de confusion de chaque modèle.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Build a logistic regression with regularizarion parameter of 100
log_reg1 = ____.____
# Build a logistic regression with regularizarion parameter of 0.1
log_reg2 = ____.____

# Predict the labels for each model
y_predict1 = log_reg1.predict(X_test)
y_predict2 = log_reg2.predict(X_test)

# Print performance metrics for each model
print('Accuracy of model 1: ', ____(____, ____))
print('Accuracy of model 2: ', ____(___, ____))
print('Confusion matrix of model 1: \n' , ____(____, ____)/len(y_test))
print('Confusion matrix of model 2: \n', ____(____, ____)/len(y_test))

Modifier et exécuter le code