Aan de slagBegin gratis

Welke artikelen lijken op 'Cristiano Ronaldo'?

In de video heb je geleerd hoe je NMF-features en de cosinusovereenkomst gebruikt om vergelijkbare artikelen te vinden. Pas dit toe op je NMF-model voor populaire Wikipedia-artikelen door de artikelen te zoeken die het meest lijken op het artikel over de voetballer Cristiano Ronaldo. De NMF-features die je eerder hebt verkregen, zijn beschikbaar als nmf_features, terwijl titles een lijst is met de artikeltitels.

Deze oefening maakt deel uit van de cursus

Unsupervised Learning in Python

Bekijk cursus

Oefeninstructies

  • Importeer normalize uit sklearn.preprocessing.
  • Pas de functie normalize() toe op nmf_features. Sla het resultaat op als norm_features.
  • Maak een DataFrame df van norm_features, met titles als index.
  • Gebruik de .loc[]-accessor van df om de rij van 'Cristiano Ronaldo' te selecteren. Ken het resultaat toe aan article.
  • Pas de .dot()-methode van df toe op article om de cosinusovereenkomst van elke rij met article te berekenen.
  • Print het resultaat van de .nlargest()-methode van similarities om de meest vergelijkbare artikelen te tonen. Dit is al voor je gedaan, dus klik op 'Antwoord verzenden' om het resultaat te zien!

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Perform the necessary imports
import pandas as pd
from ____ import ____

# Normalize the NMF features: norm_features
norm_features = ____

# Create a DataFrame: df
df = ____

# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]

# Compute the dot products: similarities
similarities = ____

# Display those with the largest cosine similarity
print(similarities.nlargest())
Code bewerken en uitvoeren