¿Qué artículos son similares a "Cristiano Ronaldo"?
En el vídeo, has aprendido a utilizar las funciones NMF y la similitud coseno para encontrar artículos similares.
Aplica esto a tu modelo NMF para artículos populares de Wikipedia, buscando los artículos más similares al artículo sobre el futbolista Cristiano Ronaldo. Las características NMF que obtuviste anteriormente están disponibles en nmf_features
, mientras que titles
es una lista de los títulos de los artículos.
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones del ejercicio
- Importa
normalize
desdesklearn.preprocessing
. - Aplica la función
normalize()
anmf_features
. Guarda el resultado comonorm_features
. - Crea un DataFrame
df
a partir denorm_features
, utilizandotitles
como índice. - Utiliza el accesorio
.loc[]
dedf
para seleccionar la fila de'Cristiano Ronaldo'
. Asigna el resultado aarticle
. - Aplica el método
.dot()
dedf
aarticle
para calcular la similitud del coseno de cada fila conarticle
. - Imprime el resultado del método
.nlargest()
desimilarities
para mostrar los artículos más similares. Ya lo hemos hecho por ti, así que pulsa "Enviar respuesta" para comprobar el resultado.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Perform the necessary imports
import pandas as pd
from ____ import ____
# Normalize the NMF features: norm_features
norm_features = ____
# Create a DataFrame: df
df = ____
# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]
# Compute the dot products: similarities
similarities = ____
# Display those with the largest cosine similarity
print(similarities.nlargest())