Aan de slagGa gratis aan de slag

Logistic regression met Twitter-data

In deze oefening bouw je een logistiek regressiemodel met de gegevensset tweets. De target wordt gegeven door airline_sentiment, die 0 is voor negatieve tweets, 1 voor neutraal en 2 voor positief. Je hebt hier dus een multi-class-classificatietaak. Alles wat we leerden over binaire problemen geldt ook voor multi-class-classificatieproblemen.

Je beoordeelt de nauwkeurigheid van het model met de twee verschillende benaderingen uit de dia's.

De functie voor logistieke regressie en de accuracy score zijn alvast voor je geïmporteerd.

Deze oefening maakt deel uit van de cursus

Sentimentanalyse in Python

Cursus bekijken

Oefeninstructies

  • Bouw en fit een logistiek regressiemodel met de gedefinieerde X en y als argumenten.
  • Bereken de nauwkeurigheid van het logistieke regressiemodel.
  • Voorspel de labels.
  • Bereken de accuracy score met de voorspelde en echte labels.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Define the vector of targets and matrix of features
y = tweets.airline_sentiment
X = tweets.drop('airline_sentiment', axis=1)

# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____)

# Create an array of prediction
y_predict = log_reg.____

# Print the accuracy using accuracy score
print('Accuracy of logistic regression: ', ____(___, ____))
Code bewerken en uitvoeren