Logistic regression sui dati di Twitter
In questo esercizio costruirai un modello di logistic regression usando l'insieme di dati tweets. Il target è dato da airline_sentiment, che vale 0 per i tweet negativi, 1 per quelli neutri e 2 per quelli positivi. Quindi, in questo caso, hai un compito di classificazione multiclasse. Tutto ciò che abbiamo imparato sui problemi binari si applica anche ai problemi di classificazione multiclasse.
Valuterai l'accuratezza del modello usando i due approcci mostrati nelle diapositive.
La funzione di logistic regression e la funzione per l'accuracy score sono già state importate per te.
Questo esercizio fa parte del corso
Sentiment Analysis con Python
Istruzioni dell'esercizio
- Crea e addestra un modello di logistic regression usando
Xeycome argomenti. - Calcola l'accuratezza del modello di logistic regression.
- Predici le etichette.
- Calcola l'accuracy score usando le etichette previste e quelle vere.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Define the vector of targets and matrix of features
y = tweets.airline_sentiment
X = tweets.drop('airline_sentiment', axis=1)
# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____)
# Create an array of prediction
y_predict = log_reg.____
# Print the accuracy using accuracy score
print('Accuracy of logistic regression: ', ____(___, ____))