Aan de slagGa gratis aan de slag

Welke artikelen lijken op 'Cristiano Ronaldo'?

In de video heb je geleerd hoe je NMF-features en de cosinusovereenkomst gebruikt om vergelijkbare artikelen te vinden. Pas dit toe op je NMF-model voor populaire Wikipedia-artikelen door de artikelen te zoeken die het meest lijken op het artikel over de voetballer Cristiano Ronaldo. De NMF-features die je eerder hebt verkregen, zijn beschikbaar als nmf_features, terwijl titles een lijst is met de artikeltitels.

Deze oefening maakt deel uit van de cursus

Unsupervised Learning in Python

Cursus bekijken

Oefeninstructies

  • Importeer normalize uit sklearn.preprocessing.
  • Pas de functie normalize() toe op nmf_features. Sla het resultaat op als norm_features.
  • Maak een DataFrame df van norm_features, met titles als index.
  • Gebruik de .loc[]-accessor van df om de rij van 'Cristiano Ronaldo' te selecteren. Ken het resultaat toe aan article.
  • Pas de .dot()-methode van df toe op article om de cosinusovereenkomst van elke rij met article te berekenen.
  • Print het resultaat van de .nlargest()-methode van similarities om de meest vergelijkbare artikelen te tonen. Dit is al voor je gedaan, dus klik op 'Antwoord verzenden' om het resultaat te zien!

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Perform the necessary imports
import pandas as pd
from ____ import ____

# Normalize the NMF features: norm_features
norm_features = ____

# Create a DataFrame: df
df = ____

# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]

# Compute the dot products: similarities
similarities = ____

# Display those with the largest cosine similarity
print(similarities.nlargest())
Code bewerken en uitvoeren