Recomendador de TED Talks
Neste exercício, vamos construir um sistema de recomendação que sugere TED Talks com base nas suas transcrições. Você recebeu uma função get_recommendations() que recebe o título de uma palestra, uma matriz de similaridade e uma série indices como argumentos, e retorna uma lista das palestras mais semelhantes. indices já foi fornecida para você.
Você também recebeu uma série transcripts que contém as transcrições de cerca de 500 TED Talks. Sua tarefa é gerar uma matriz de similaridade cosseno para os vetores tf-idf das transcrições.
Em seguida, vamos gerar recomendações para a palestra intitulada '5 ways to kill your dreams', da empreendedora brasileira Bel Pesce.
Este exercício faz parte do curso
Feature Engineering para NLP em Python
Instruções do exercício
- Inicialize um
TfidfVectorizercom stopwords em inglês. Dê a ele o nometfidf. - Construa
tfidf_matrixajustando e transformandotranscripts. - Gere a matriz de similaridade cosseno
cosine_simusandotfidf_matrix. - Use
get_recommendations()para gerar recomendações para '5 ways to kill your dreams'.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Initialize the TfidfVectorizer
tfidf = ____
# Construct the TF-IDF matrix
tfidf_matrix = ____
# Generate the cosine similarity matrix
cosine_sim = ____
# Generate recommendations
print(get_recommendations(____, ____, indices))