Stimmungsanalyse
In der Videoübung hast du die verschiedenen Anwendungen von Sequenz-zu-Sequenz-Modellen kennengelernt. In dieser Übung lernst du, wie du ein vortrainiertes Modell für die Sentimentanalyse nutzen kannst.
Das Modell ist in der Umgebung unter der Variablen „ model “ schon geladen. Außerdem gibt's die tokenisierten Testset-Variablen „ X_test “ und „ y_test “ sowie die vorverarbeiteten Originaltextdaten „ sentences “ von IMDb. Wie du die Textdaten vorverarbeitest und das Modell mit Keras erstellst und trainierst, lernst du später im Kurs.
Du wirst das vorab trainierte Modell nutzen, um Vorhersagen zur Stimmung zu machen. Das Modell gibt eine Zahl zwischen null und eins zurück, die die Wahrscheinlichkeit angibt, dass der Satz eine positive Stimmung hat. Du erstellst also eine Entscheidungsregel, um die Vorhersage auf positiv oder negativ zu setzen.
Diese Übung ist Teil des Kurses
Rekursive neuronale Netze (RNNs) für die Sprachmodellierung mit Keras
Anleitung zur Übung
- Verwende die Methode „
.predict()“, um Vorhersagen für die Testdaten zu treffen. - Mach die Vorhersage gleich „
"positive"“, wenn ihr Wert größer ist als „0.5“ und „"negative"“ ansonsten, und speicher das Ergebnis in der Variablen „pred_sentiment“. - Erstell eine Variable namens „
pd.DataFrame“, die den vorbereiteten Text, die vorherige Vorhersage und die echten Werte aus der Variable „y_test“ enthält. - Druck die ersten Zeilen mit der Methode „
.head()“.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Inspect the first sentence on `X_test`
print(X_test[0])
# Get the predicion for all the sentences
pred = model.predict(____)
# Transform the predition into positive (> 0.5) or negative (<= 0.5)
pred_sentiment = ["positive" if x>____ else "negative" for x in pred]
# Create a data frame with sentences, predictions and true values
result = pd.DataFrame({'sentence': sentences, 'y_pred': ____, 'y_true': y_test})
# Print the first lines of the data frame
print(result.____)