Welche Artikel sind ähnlich wie "Cristiano Ronaldo"?
Im Video hast du gelernt, wie du mit den Funktionen von NMF und der Kosinusähnlichkeit ähnliche Artikel finden kannst.
Wende dies auf dein NMF Modell für beliebte Wikipedia-Artikel an, indem du die Artikel findest, die dem Artikel über den Fußballspieler Cristiano Ronaldo am ähnlichsten sind. Die NMF Funktionen, die du zuvor erhalten hast, sind als nmf_features
verfügbar, während titles
eine Liste der Artikeltitel ist.
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
- Importiere
normalize
vonsklearn.preprocessing
. - Wende die Funktion
normalize()
aufnmf_features
an. Speichere das Ergebnis alsnorm_features
. - Erstelle einen DataFrame
df
ausnorm_features
, indem dutitles
als Index verwendest. - Benutze den
.loc[]
Accessor vondf
, um die Zeile von'Cristiano Ronaldo'
auszuwählen. Weise das Ergebnisarticle
zu. - Wende die Methode
.dot()
vondf
aufarticle
an, um die Kosinusähnlichkeit jeder Zeile mitarticle
zu berechnen. - Drucke das Ergebnis der Methode
.nlargest()
vonsimilarities
aus, um die ähnlichsten Artikel anzuzeigen. Das haben wir für dich getan, also klick auf "Antwort abschicken", um das Ergebnis zu sehen!
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Perform the necessary imports
import pandas as pd
from ____ import ____
# Normalize the NMF features: norm_features
norm_features = ____
# Create a DataFrame: df
df = ____
# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]
# Compute the dot products: similarities
similarities = ____
# Display those with the largest cosine similarity
print(similarities.nlargest())