Welche Artikel sind ähnlich wie „Cristiano Ronaldo“?
Im Video hast du gelernt, wie du NMF-Funktionen und die Kosinusähnlichkeit nutzen kannst, um ähnliche Artikel zu finden.
Probier das mal mit deinem NMF-Modell für beliebte Wikipedia-Artikel aus, indem du die Artikel suchst, die dem Artikel über den Fußballer Cristiano Ronaldo am ähnlichsten sind. Die NMF-Funktionen, die du vorhin bekommen hast, findest du unter „ nmf_features
“, während „ titles
“ eine Liste der Artikeltitel ist.
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
- Importiere
normalize
aussklearn.preprocessing
. - Wende die Funktion „
normalize()
“ auf „nmf_features
“ an. Speichere das Ergebnis alsnorm_features
. - Erstell einen DataFrame „
df
” aus „norm_features
”, wobei „titles
” als Index verwendet wird. - Verwende den Zugriff „
.loc[]
” von „df
”, um die Zeile „'Cristiano Ronaldo'
” auszuwählen. Weise das Ergebnisarticle
zu. - Wende die „
.dot()
”-Methode vondf
aufarticle
an, um die Kosinusähnlichkeit jeder Zeile mitarticle
zu berechnen. - Druck das Ergebnis der Methode „
.nlargest()
“ von „similarities
“, um die ähnlichsten Artikel anzuzeigen. Das haben wir schon für dich erledigt, also klick einfach auf „Antwort senden“, um das Ergebnis zu sehen!
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Perform the necessary imports
import pandas as pd
from ____ import ____
# Normalize the NMF features: norm_features
norm_features = ____
# Create a DataFrame: df
df = ____
# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]
# Compute the dot products: similarities
similarities = ____
# Display those with the largest cosine similarity
print(similarities.nlargest())