Aan de slagGa gratis aan de slag

Sentimentanalyse

In de video-oefening heb je verschillende toepassingen van sequence-to-sequence-modellen gezien. In deze oefening ga je een voorgetraind model gebruiken voor sentimentanalyse.

Het model is al in de omgeving geladen in de variabele model. Ook de getokenizde testsetvariabelen X_test en y_test en de voorbewerkte oorspronkelijke tekstdata sentences van IMDb zijn beschikbaar. Later in de cursus leer je hoe je de tekstdata voorbewerkt en hoe je het model maakt en traint met Keras.

Je gebruikt het voorgetrainde model om sentimentvoorspellingen te krijgen. Het model geeft een getal tussen nul en één terug dat de kans weergeeft dat een zin een positief sentiment heeft. Maak daarom een beslisregel om de voorspelling als positief of negatief te labelen.

Deze oefening maakt deel uit van de cursus

Recurrent Neural Networks (RNN's) voor taalmodellen met Keras

Cursus bekijken

Oefeninstructies

  • Gebruik de methode .predict() om voorspellingen te maken op de testdata.
  • Stel de voorspelling gelijk aan "positive" als de waarde groter is dan 0.5, en anders "negative", en sla het resultaat op in de variabele pred_sentiment.
  • Maak een pd.DataFrame met de voorbewerkte tekst, de voorspelling uit de vorige stap en de ware waarden in de variabele y_test.
  • Print de eerste rijen met de methode .head().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Inspect the first sentence on `X_test`
print(X_test[0])

# Get the predicion for all the sentences
pred = model.predict(____)

# Transform the predition into positive (> 0.5) or negative (<= 0.5)
pred_sentiment = ["positive" if x>____ else "negative" for x in pred]

# Create a data frame with sentences, predictions and true values
result = pd.DataFrame({'sentence': sentences, 'y_pred': ____, 'y_true': y_test})

# Print the first lines of the data frame
print(result.____)
Code bewerken en uitvoeren