Die positivsten und negativsten Wörter identifizieren

In dieser Übung versuchen wir, die Koeffizienten einer Logit-Regression zu interpretieren, die auf den Sentiments eines Datensatzes mit Filmkritiken trainiert wurde. Das Modellobjekt ist bereits in der Variable lr instanziiert und für dich trainiert.

Außerdem sind die Wörter, die den einzelnen Merkmalen entsprechen, in die Variable vocab geladen. Zum Beispiel: Da vocab[100] „think“ ist, bedeutet das, dass Merkmal 100 der Anzahl entspricht, wie oft das Wort „think“ in dieser Filmkritik vorkam.

Diese Übung ist Teil des Kurses

Lineare Klassifikatoren in Python

Kurs anzeigen

Anleitung zur Übung

Finde die Wörter, die den 5 größten Koeffizienten entsprechen.
Finde die Wörter, die den 5 kleinsten Koeffizienten entsprechen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Get the indices of the sorted cofficients
inds_ascending = np.argsort(lr.coef_.flatten()) 
inds_descending = inds_ascending[::-1]

# Print the most positive words
print("Most positive words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")

# Print most negative words
print("Most negative words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")

Code bearbeiten und ausführen