Crea e valuta un modello: dati delle recensioni di prodotti
In questo esercizio costruirai una logistic regression usando il dataset reviews, che contiene le recensioni dei clienti su prodotti Amazon. L'array y contiene il sentiment: 1 se positivo e 0 altrimenti. L'array X contiene tutte le caratteristiche numeriche create con un approccio BOW. Sentiti libero di esplorarle nell'IPython Shell.
Il tuo compito è creare un modello di logistic regression e calcolare l'accuracy e la confusion matrix usando il dataset di test.
Le funzioni per la logistic regression e per lo split train/test sono già state importate per te.
Questo esercizio fa parte del corso
Sentiment Analysis con Python
Istruzioni dell'esercizio
- Importa le funzioni per accuracy score e confusion matrix.
- Dividi i dati in training e testing, usando il 30% come test set e imposta il seme casuale a
42. - Allena un modello di logistic regression.
- Stampa l'accuracy score e la confusion matrix usando i dati di test.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the accuracy and confusion matrix
____
# Split the data into training and testing
X_train, X_test, y_train, y_test = ____(____, ____, ____=0.3, ____=42)
# Build a logistic regression
log_reg = ____._____
# Predict the labels
y_predict = log_reg.predict(X_test)
# Print the performance metrics
print('Accuracy score of test data: ', ____(____, ____))
print('Confusion matrix of test data: \n', ____(____, ____)/len(y_test))