ComeçarComece de graça

Quais artigos são parecidos com “Cristiano Ronaldo”?

No vídeo, você aprendeu a usar os recursos NMF e a similaridade cosinusoidal para encontrar artigos parecidos. Aplique isso ao seu modelo NMF para artigos populares da Wikipedia, encontrando os artigos mais parecidos com o artigo sobre o jogador de futebol Cristiano Ronaldo. Os recursos NMF que você conseguiu antes estão disponíveis em nmf_features, enquanto titles é uma lista dos títulos dos artigos.

Este exercício faz parte do curso

Aprendizado não supervisionado em Python

Ver curso

Instruções do exercício

  • Importe normalize de sklearn.preprocessing.
  • Aplique a função “ normalize() ” (Convertendo a data em um número) a nmf_features. Armazene o resultado como norm_features.
  • Crie um DataFrame chamado “ df ” a partir de “ norm_features ”, usando “ titles ” como índice.
  • Use o acessor .loc[] de df para escolher a linha de 'Cristiano Ronaldo'. Atribua o resultado a article.
  • Aplique o método “ .dot() ” de df a article para calcular a similaridade coseno de cada linha com article.
  • Imprima o resultado do método .nlargest() de similarities para mostrar os artigos mais parecidos. Isso foi feito para você, então clique em "Enviar resposta" para conferir o resultado!

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Perform the necessary imports
import pandas as pd
from ____ import ____

# Normalize the NMF features: norm_features
norm_features = ____

# Create a DataFrame: df
df = ____

# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]

# Compute the dot products: similarities
similarities = ____

# Display those with the largest cosine similarity
print(similarities.nlargest())
Editar e executar o código