Quais artigos são parecidos com “Cristiano Ronaldo”?
No vídeo, você aprendeu a usar os recursos NMF e a similaridade cosinusoidal para encontrar artigos parecidos.
Aplique isso ao seu modelo NMF para artigos populares da Wikipedia, encontrando os artigos mais parecidos com o artigo sobre o jogador de futebol Cristiano Ronaldo. Os recursos NMF que você conseguiu antes estão disponíveis em nmf_features
, enquanto titles
é uma lista dos títulos dos artigos.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
- Importe
normalize
desklearn.preprocessing
. - Aplique a função “
normalize()
” (Convertendo a data em um número) anmf_features
. Armazene o resultado comonorm_features
. - Crie um DataFrame chamado “
df
” a partir de “norm_features
”, usando “titles
” como índice. - Use o acessor
.loc[]
dedf
para escolher a linha de'Cristiano Ronaldo'
. Atribua o resultado aarticle
. - Aplique o método “
.dot()
” dedf
aarticle
para calcular a similaridade coseno de cada linha comarticle
. - Imprima o resultado do método
.nlargest()
desimilarities
para mostrar os artigos mais parecidos. Isso foi feito para você, então clique em "Enviar resposta" para conferir o resultado!
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Perform the necessary imports
import pandas as pd
from ____ import ____
# Normalize the NMF features: norm_features
norm_features = ____
# Create a DataFrame: df
df = ____
# Select the row corresponding to 'Cristiano Ronaldo': article
article = df.loc[____]
# Compute the dot products: similarities
similarities = ____
# Display those with the largest cosine similarity
print(similarities.nlargest())