Crea e valuta un modello: dati delle recensioni di prodotti

In questo esercizio costruirai una logistic regression usando il dataset reviews, che contiene le recensioni dei clienti su prodotti Amazon. L'array y contiene il sentiment: 1 se positivo e 0 altrimenti. L'array X contiene tutte le caratteristiche numeriche create con un approccio BOW. Sentiti libero di esplorarle nell'IPython Shell.

Il tuo compito è creare un modello di logistic regression e calcolare l'accuracy e la confusion matrix usando il dataset di test.

Le funzioni per la logistic regression e per lo split train/test sono già state importate per te.

Questo esercizio fa parte del corso

Sentiment Analysis con Python

Visualizza corso

Istruzioni dell'esercizio

Importa le funzioni per accuracy score e confusion matrix.
Dividi i dati in training e testing, usando il 30% come test set e imposta il seme casuale a 42.
Allena un modello di logistic regression.
Stampa l'accuracy score e la confusion matrix usando i dati di test.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Import the accuracy and confusion matrix
____

# Split the data into training and testing
X_train, X_test, y_train, y_test = ____(____, ____, ____=0.3, ____=42)

# Build a logistic regression
log_reg = ____._____

# Predict the labels 
y_predict = log_reg.predict(X_test)

# Print the performance metrics
print('Accuracy score of test data: ', ____(____, ____))
print('Confusion matrix of test data: \n', ____(____, ____)/len(y_test))

Modifica ed esegui il codice