Erste SchritteKostenlos loslegen

Welche Artikel sind ähnlich wie "Cristiano Ronaldo"?

Im Video hast du gelernt, wie du mit den Funktionen von NMF und der Kosinusähnlichkeit ähnliche Artikel finden kannst. Wende dies auf dein NMF Modell für beliebte Wikipedia-Artikel an, indem du die Artikel findest, die dem Artikel über den Fußballspieler Cristiano Ronaldo am ähnlichsten sind. Die NMF Funktionen, die du zuvor erhalten hast, sind als nmf_features verfügbar, während titles eine Liste der Artikeltitel ist.

Diese Übung ist Teil des Kurses

Unüberwachtes Lernen in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere normalize von sklearn.preprocessing.
  • Wende die Funktion normalize() auf nmf_features an. Speichere das Ergebnis als norm_features.
  • Erstelle einen DataFrame df aus norm_features, indem du titles als Index verwendest.
  • Benutze den .loc[] Accessor von df, um die Zeile von 'Cristiano Ronaldo' auszuwählen. Weise das Ergebnis article zu.
  • Wende die Methode .dot() von df auf article an, um die Kosinusähnlichkeit jeder Zeile mit article zu berechnen.
  • Drucke das Ergebnis der Methode .nlargest() von similarities aus, um die ähnlichsten Artikel anzuzeigen. Das haben wir für dich getan, also klick auf "Antwort abschicken", um das Ergebnis zu sehen!

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Perform the necessary imports
import pandas as pd
from ____ import ____

# Normalize the NMF features: norm_features
norm_features = ____

# Create a DataFrame: df
df = ____

# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]

# Compute the dot products: similarities
similarities = ____

# Display those with the largest cosine similarity
print(similarities.nlargest())
Bearbeiten und Ausführen von Code