¿Qué artículos son similares a "Cristiano Ronaldo"?
En el vídeo, has aprendido a utilizar las funciones NMF y la similitud coseno para encontrar artículos similares.
Aplica esto a tu modelo NMF para artículos populares de Wikipedia, buscando los artículos más similares al artículo sobre el futbolista Cristiano Ronaldo. Las características NMF que obtuviste anteriormente están disponibles en nmf_features, mientras que titles es una lista de los títulos de los artículos.
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones del ejercicio
- Importa
normalizedesdesklearn.preprocessing. - Aplica la función
normalize()anmf_features. Guarda el resultado comonorm_features. - Crea un DataFrame
dfa partir denorm_features, utilizandotitlescomo índice. - Utiliza el accesorio
.loc[]dedfpara seleccionar la fila de'Cristiano Ronaldo'. Asigna el resultado aarticle. - Aplica el método
.dot()dedfaarticlepara calcular la similitud del coseno de cada fila conarticle. - Imprime el resultado del método
.nlargest()desimilaritiespara mostrar los artículos más similares. Ya lo hemos hecho por ti, así que pulsa "Enviar respuesta" para comprobar el resultado.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Perform the necessary imports
import pandas as pd
from ____ import ____
# Normalize the NMF features: norm_features
norm_features = ____
# Create a DataFrame: df
df = ____
# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]
# Compute the dot products: similarities
similarities = ____
# Display those with the largest cosine similarity
print(similarities.nlargest())