Construire et évaluer un modèle : données d’avis produits
Dans cet exercice, vous allez construire une régression logistique à l’aide du jeu de données reviews, qui contient des avis de clients sur des produits Amazon. Le tableau y contient le sentiment : 1 si l’avis est positif et 0 sinon. Le tableau X contient toutes les variables numériques créées via une approche BOW. N’hésitez pas à les explorer dans l’IPython Shell.
Votre tâche est de construire un modèle de régression logistique et de calculer l’exactitude (accuracy) et la matrice de confusion à l’aide du jeu de test.
La régression logistique et les fonctions de séparation entraînement/test ont été importées pour vous.
Cet exercice fait partie du cours
Analyse de sentiments en Python
Instructions
- Importez les fonctions d’exactitude (accuracy score) et de matrice de confusion.
- Divisez les données en ensembles d’entraînement et de test, en utilisant 30 % pour le test et en fixant la graine aléatoire à
42. - Entraînez un modèle de régression logistique.
- Affichez l’exactitude et la matrice de confusion en utilisant les données de test.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the accuracy and confusion matrix
____
# Split the data into training and testing
X_train, X_test, y_train, y_test = ____(____, ____, ____=0.3, ____=42)
# Build a logistic regression
log_reg = ____._____
# Predict the labels
y_predict = log_reg.predict(X_test)
# Print the performance metrics
print('Accuracy score of test data: ', ____(____, ____))
print('Confusion matrix of test data: \n', ____(____, ____)/len(y_test))