¿Qué artículos son similares a "Cristiano Ronaldo"?
En el vídeo, aprendiste a utilizar las características de NMF y la similitud del coseno para encontrar artículos similares.
Aplica esto a tu modelo NMF para artículos populares de Wikipedia, encontrando los artículos más similares al artículo sobre el futbolista Cristiano Ronaldo. Las características de NMF que obtuviste anteriormente están disponibles como nmf_features
, mientras que titles
es una lista de los títulos de los artículos.
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones de ejercicio
- Importa
normalize
desdesklearn.preprocessing
. - Aplica la función
normalize()
anmf_features
. Guarda el resultado comonorm_features
. - Crea un DataFrame
df
a partir denorm_features
, utilizandotitles
como índice. - Utiliza el accesorio
.loc[]
dedf
para seleccionar la fila de'Cristiano Ronaldo'
. Asigna el resultado aarticle
. - Aplica el método
.dot()
dedf
aarticle
para calcular la similitud del coseno de cada fila conarticle
. - Imprime el resultado del método
.nlargest()
desimilarities
para mostrar los artículos más similares. Ya lo hemos hecho por ti, así que pulsa "Enviar respuesta" para comprobar el resultado.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Perform the necessary imports
import pandas as pd
from ____ import ____
# Normalize the NMF features: norm_features
norm_features = ____
# Create a DataFrame: df
df = ____
# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]
# Compute the dot products: similarities
similarities = ____
# Display those with the largest cosine similarity
print(similarities.nlargest())