Logistic regression sui dati di Twitter

In questo esercizio costruirai un modello di logistic regression usando l'insieme di dati tweets. Il target è dato da airline_sentiment, che vale 0 per i tweet negativi, 1 per quelli neutri e 2 per quelli positivi. Quindi, in questo caso, hai un compito di classificazione multiclasse. Tutto ciò che abbiamo imparato sui problemi binari si applica anche ai problemi di classificazione multiclasse.

Valuterai l'accuratezza del modello usando i due approcci mostrati nelle diapositive.

La funzione di logistic regression e la funzione per l'accuracy score sono già state importate per te.

Questo esercizio fa parte del corso

Sentiment Analysis con Python

Visualizza corso

Istruzioni dell'esercizio

Crea e addestra un modello di logistic regression usando X e y come argomenti.
Calcola l'accuratezza del modello di logistic regression.
Predici le etichette.
Calcola l'accuracy score usando le etichette previste e quelle vere.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Define the vector of targets and matrix of features
y = tweets.airline_sentiment
X = tweets.drop('airline_sentiment', axis=1)

# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____)

# Create an array of prediction
y_predict = log_reg.____

# Print the accuracy using accuracy score
print('Accuracy of logistic regression: ', ____(___, ____))

Modifica ed esegui il codice