Die positivsten und negativsten Wörter identifizieren
In dieser Übung versuchen wir, die Koeffizienten einer Logit-Regression zu interpretieren, die auf den Sentiments eines Datensatzes mit Filmkritiken trainiert wurde. Das Modellobjekt ist bereits in der Variable lr instanziiert und für dich trainiert.
Außerdem sind die Wörter, die den einzelnen Merkmalen entsprechen, in die Variable vocab geladen. Zum Beispiel: Da vocab[100] „think“ ist, bedeutet das, dass Merkmal 100 der Anzahl entspricht, wie oft das Wort „think“ in dieser Filmkritik vorkam.
Diese Übung ist Teil des Kurses
Lineare Klassifikatoren in Python
Anleitung zur Übung
- Finde die Wörter, die den 5 größten Koeffizienten entsprechen.
- Finde die Wörter, die den 5 kleinsten Koeffizienten entsprechen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Get the indices of the sorted cofficients
inds_ascending = np.argsort(lr.coef_.flatten())
inds_descending = inds_ascending[::-1]
# Print the most positive words
print("Most positive words: ", end="")
for i in range(5):
print(____, end=", ")
print("\n")
# Print most negative words
print("Most negative words: ", end="")
for i in range(5):
print(____, end=", ")
print("\n")