ComenzarEmpieza gratis

¿Qué artículos son similares a "Cristiano Ronaldo"?

En el vídeo, aprendiste a utilizar las características de NMF y la similitud del coseno para encontrar artículos similares. Aplica esto a tu modelo NMF para artículos populares de Wikipedia, encontrando los artículos más similares al artículo sobre el futbolista Cristiano Ronaldo. Las características de NMF que obtuviste anteriormente están disponibles como nmf_features, mientras que titles es una lista de los títulos de los artículos.

Este ejercicio forma parte del curso

Aprendizaje no supervisado en Python

Ver curso

Instrucciones de ejercicio

  • Importa normalize desde sklearn.preprocessing.
  • Aplica la función normalize() a nmf_features. Guarda el resultado como norm_features.
  • Crea un DataFrame df a partir de norm_features, utilizando titles como índice.
  • Utiliza el accesorio .loc[] de df para seleccionar la fila de 'Cristiano Ronaldo'. Asigna el resultado a article.
  • Aplica el método .dot() de df a article para calcular la similitud del coseno de cada fila con article.
  • Imprime el resultado del método .nlargest() de similarities para mostrar los artículos más similares. Ya lo hemos hecho por ti, así que pulsa "Enviar respuesta" para comprobar el resultado.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Perform the necessary imports
import pandas as pd
from ____ import ____

# Normalize the NMF features: norm_features
norm_features = ____

# Create a DataFrame: df
df = ____

# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]

# Compute the dot products: similarities
similarities = ____

# Display those with the largest cosine similarity
print(similarities.nlargest())
Editar y ejecutar código