Quali articoli sono simili a 'Cristiano Ronaldo'?
Nel video hai visto come usare le feature NMF e la similarità coseno per trovare articoli simili.
Applica questo al tuo modello NMF per gli articoli popolari di Wikipedia, trovando quelli più simili all’articolo sul calciatore Cristiano Ronaldo. Le feature NMF che hai ottenuto in precedenza sono disponibili come nmf_features, mentre titles è un elenco dei titoli degli articoli.
Questo esercizio fa parte del corso
Apprendimento non supervisionato in Python
Istruzioni dell'esercizio
- Importa
normalizedasklearn.preprocessing. - Applica la funzione
normalize()anmf_features. Salva il risultato comenorm_features. - Crea un DataFrame
dfdanorm_features, usandotitlescome indice. - Usa l’accessor
.loc[]didfper selezionare la riga di'Cristiano Ronaldo'. Assegna il risultato aarticle. - Applica il metodo
.dot()didfaarticleper calcolare la similarità coseno di ogni riga conarticle. - Stampa il risultato del metodo
.nlargest()disimilaritiesper mostrare gli articoli più simili. Questo è già stato fatto per te, quindi fai clic su "Invia risposta" per vedere il risultato!
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Perform the necessary imports
import pandas as pd
from ____ import ____
# Normalize the NMF features: norm_features
norm_features = ____
# Create a DataFrame: df
df = ____
# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]
# Compute the dot products: similarities
similarities = ____
# Display those with the largest cosine similarity
print(similarities.nlargest())