Welke artikelen lijken op 'Cristiano Ronaldo'?
In de video heb je geleerd hoe je NMF-features en de cosinusovereenkomst gebruikt om vergelijkbare artikelen te vinden.
Pas dit toe op je NMF-model voor populaire Wikipedia-artikelen door de artikelen te zoeken die het meest lijken op het artikel over de voetballer Cristiano Ronaldo. De NMF-features die je eerder hebt verkregen, zijn beschikbaar als nmf_features, terwijl titles een lijst is met de artikeltitels.
Deze oefening maakt deel uit van de cursus
Unsupervised Learning in Python
Oefeninstructies
- Importeer
normalizeuitsklearn.preprocessing. - Pas de functie
normalize()toe opnmf_features. Sla het resultaat op alsnorm_features. - Maak een DataFrame
dfvannorm_features, mettitlesals index. - Gebruik de
.loc[]-accessor vandfom de rij van'Cristiano Ronaldo'te selecteren. Ken het resultaat toe aanarticle. - Pas de
.dot()-methode vandftoe oparticleom de cosinusovereenkomst van elke rij metarticlete berekenen. - Print het resultaat van de
.nlargest()-methode vansimilaritiesom de meest vergelijkbare artikelen te tonen. Dit is al voor je gedaan, dus klik op 'Antwoord verzenden' om het resultaat te zien!
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Perform the necessary imports
import pandas as pd
from ____ import ____
# Normalize the NMF features: norm_features
norm_features = ____
# Create a DataFrame: df
df = ____
# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]
# Compute the dot products: similarities
similarities = ____
# Display those with the largest cosine similarity
print(similarities.nlargest())