Mecanismo de recomendação de enredos
Neste exercício, vamos construir um mecanismo de recomendação que sugere filmes com base na similaridade dos enredos. Você recebeu uma função get_recommendations() que recebe o título de um filme, uma matriz de similaridade e uma série indices como argumentos e retorna uma lista dos filmes mais semelhantes. indices já foi fornecida para você.
Você também recebeu uma Series movie_plots que contém os enredos de vários filmes. Sua tarefa é gerar uma matriz de similaridade cosseno para os vetores tf-idf desses enredos.
Em seguida, vamos verificar a eficácia do nosso mecanismo gerando recomendações para um dos meus filmes favoritos, The Dark Knight Rises.
Este exercício faz parte do curso
Feature Engineering para NLP em Python
Instruções do exercício
- Inicialize um
TfidfVectorizercomstop_wordsem inglês. Nomeie-o detfidf. - Construa
tfidf_matrixajustando e transformando os dados de enredo dos filmes usandofit_transform(). - Gere a matriz de similaridade cosseno
cosine_simusandotfidf_matrix. Não usecosine_similarity()! - Use
get_recommendations()para gerar recomendações para'The Dark Knight Rises'.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Initialize the TfidfVectorizer
tfidf = ____(____='english')
# Construct the TF-IDF matrix
tfidf_matrix = tfidf.____(movie_plots)
# Generate the cosine similarity matrix
cosine_sim = ____(tfidf_matrix, tfidf_matrix)
# Generate recommendations
print(get_recommendations(____, cosine_sim, indices))