LoslegenKostenlos loslegen

Welche Artikel sind ähnlich wie „Cristiano Ronaldo“?

Im Video hast du gelernt, wie du NMF-Funktionen und die Kosinusähnlichkeit nutzen kannst, um ähnliche Artikel zu finden. Probier das mal mit deinem NMF-Modell für beliebte Wikipedia-Artikel aus, indem du die Artikel suchst, die dem Artikel über den Fußballer Cristiano Ronaldo am ähnlichsten sind. Die NMF-Funktionen, die du vorhin bekommen hast, findest du unter „ nmf_features “, während „ titles “ eine Liste der Artikeltitel ist.

Diese Übung ist Teil des Kurses

Unüberwachtes Lernen in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere normalize aus sklearn.preprocessing.
  • Wende die Funktion „ normalize() “ auf „ nmf_features “ an. Speichere das Ergebnis als norm_features.
  • Erstell einen DataFrame „ df ” aus „ norm_features ”, wobei „ titles ” als Index verwendet wird.
  • Verwende den Zugriff „ .loc[] ” von „ df ”, um die Zeile „ 'Cristiano Ronaldo' ” auszuwählen. Weise das Ergebnis article zu.
  • Wende die „ .dot() ”-Methode von df auf article an, um die Kosinusähnlichkeit jeder Zeile mit article zu berechnen.
  • Druck das Ergebnis der Methode „ .nlargest() “ von „ similarities “, um die ähnlichsten Artikel anzuzeigen. Das haben wir schon für dich erledigt, also klick einfach auf „Antwort senden“, um das Ergebnis zu sehen!

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Perform the necessary imports
import pandas as pd
from ____ import ____

# Normalize the NMF features: norm_features
norm_features = ____

# Create a DataFrame: df
df = ____

# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]

# Compute the dot products: similarities
similarities = ____

# Display those with the largest cosine similarity
print(similarities.nlargest())
Code bearbeiten und ausführen