CommencerCommencer gratuitement

Construire et évaluer un modèle : données d’avis produits

Dans cet exercice, vous allez construire une régression logistique à l’aide du jeu de données reviews, qui contient des avis de clients sur des produits Amazon. Le tableau y contient le sentiment : 1 si l’avis est positif et 0 sinon. Le tableau X contient toutes les variables numériques créées via une approche BOW. N’hésitez pas à les explorer dans l’IPython Shell.

Votre tâche est de construire un modèle de régression logistique et de calculer l’exactitude (accuracy) et la matrice de confusion à l’aide du jeu de test.

La régression logistique et les fonctions de séparation entraînement/test ont été importées pour vous.

Cet exercice fait partie du cours

Analyse de sentiments en Python

Afficher le cours

Instructions

  • Importez les fonctions d’exactitude (accuracy score) et de matrice de confusion.
  • Divisez les données en ensembles d’entraînement et de test, en utilisant 30 % pour le test et en fixant la graine aléatoire à 42.
  • Entraînez un modèle de régression logistique.
  • Affichez l’exactitude et la matrice de confusion en utilisant les données de test.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import the accuracy and confusion matrix
____

# Split the data into training and testing
X_train, X_test, y_train, y_test = ____(____, ____, ____=0.3, ____=42)

# Build a logistic regression
log_reg = ____._____

# Predict the labels 
y_predict = log_reg.predict(X_test)

# Print the performance metrics
print('Accuracy score of test data: ', ____(____, ____))
print('Confusion matrix of test data: \n', ____(____, ____)/len(y_test))
Modifier et exécuter le code