Quais artigos são parecidos com “Cristiano Ronaldo”?
No vídeo, você aprendeu a usar os recursos NMF e a similaridade cosinusoidal para encontrar artigos parecidos.
Aplique isso ao seu modelo NMF para artigos populares da Wikipedia, encontrando os artigos mais parecidos com o artigo sobre o jogador de futebol Cristiano Ronaldo. Os recursos NMF que você conseguiu antes estão disponíveis em nmf_features, enquanto titles é uma lista dos títulos dos artigos.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
- Importe
normalizedesklearn.preprocessing. - Aplique a função “
normalize()” (Convertendo a data em um número) anmf_features. Armazene o resultado comonorm_features. - Crie um DataFrame chamado “
df” a partir de “norm_features”, usando “titles” como índice. - Use o acessor
.loc[]dedfpara escolher a linha de'Cristiano Ronaldo'. Atribua o resultado aarticle. - Aplique o método “
.dot()” dedfaarticlepara calcular a similaridade coseno de cada linha comarticle. - Imprima o resultado do método
.nlargest()desimilaritiespara mostrar os artigos mais parecidos. Isso foi feito para você, então clique em "Enviar resposta" para conferir o resultado!
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Perform the necessary imports
import pandas as pd
from ____ import ____
# Normalize the NMF features: norm_features
norm_features = ____
# Create a DataFrame: df
df = ____
# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]
# Compute the dot products: similarities
similarities = ____
# Display those with the largest cosine similarity
print(similarities.nlargest())