Welche Artikel sind ähnlich zu 'Cristiano Ronaldo'?
Im Video hast du gelernt, wie du NMF-Merkmale und die Kosinus-Ähnlichkeit nutzt, um ähnliche Artikel zu finden.
Wende das auf dein NMF-Modell für beliebte Wikipedia-Artikel an, indem du die Artikel findest, die dem Artikel über den Fußballer Cristiano Ronaldo am ähnlichsten sind. Die NMF-Merkmale, die du zuvor erhalten hast, stehen als nmf_features zur Verfügung, und titles ist eine Liste der Artikeltitel.
Diese Übung ist Teil des Kurses
Unsupervised Learning in Python
Anleitung zur Übung
- Importiere
normalizeaussklearn.preprocessing. - Wende die Funktion
normalize()aufnmf_featuresan. Speichere das Ergebnis alsnorm_features. - Erstelle ein DataFrame
dfausnorm_featuresund verwendetitlesals Index. - Verwende
.loc[]vondf, um die Zeile von'Cristiano Ronaldo'auszuwählen. Weise das Ergebnisarticlezu. - Wende die Methode
.dot()vondfaufarticlean, um die Kosinus-Ähnlichkeit jeder Zeile mitarticlezu berechnen. - Gib das Ergebnis der Methode
.nlargest()vonsimilaritiesaus, um die ähnlichsten Artikel anzuzeigen. Das wurde bereits für dich erledigt, also klicke auf 'Antworten', um das Ergebnis zu sehen!
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Perform the necessary imports
import pandas as pd
from ____ import ____
# Normalize the NMF features: norm_features
norm_features = ____
# Create a DataFrame: df
df = ____
# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]
# Compute the dot products: similarities
similarities = ____
# Display those with the largest cosine similarity
print(similarities.nlargest())