Sentimentanalyse
In de video-oefening heb je verschillende toepassingen van sequence-to-sequence-modellen gezien. In deze oefening ga je een voorgetraind model gebruiken voor sentimentanalyse.
Het model is al in de omgeving geladen in de variabele model. Ook de getokenizde testsetvariabelen X_test en y_test en de voorbewerkte oorspronkelijke tekstdata sentences van IMDb zijn beschikbaar. Later in de cursus leer je hoe je de tekstdata voorbewerkt en hoe je het model maakt en traint met Keras.
Je gebruikt het voorgetrainde model om sentimentvoorspellingen te krijgen. Het model geeft een getal tussen nul en één terug dat de kans weergeeft dat een zin een positief sentiment heeft. Maak daarom een beslisregel om de voorspelling als positief of negatief te labelen.
Deze oefening maakt deel uit van de cursus
Recurrent Neural Networks (RNN's) voor taalmodellen met Keras
Oefeninstructies
- Gebruik de methode
.predict()om voorspellingen te maken op de testdata. - Stel de voorspelling gelijk aan
"positive"als de waarde groter is dan0.5, en anders"negative", en sla het resultaat op in de variabelepred_sentiment. - Maak een
pd.DataFramemet de voorbewerkte tekst, de voorspelling uit de vorige stap en de ware waarden in de variabeley_test. - Print de eerste rijen met de methode
.head().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Inspect the first sentence on `X_test`
print(X_test[0])
# Get the predicion for all the sentences
pred = model.predict(____)
# Transform the predition into positive (> 0.5) or negative (<= 0.5)
pred_sentiment = ["positive" if x>____ else "negative" for x in pred]
# Create a data frame with sentences, predictions and true values
result = pd.DataFrame({'sentence': sentences, 'y_pred': ____, 'y_true': y_test})
# Print the first lines of the data frame
print(result.____)