ComeçarComece de graça

Recomendador de TED Talks

Neste exercício, vamos construir um sistema de recomendação que sugere TED Talks com base nas suas transcrições. Você recebeu uma função get_recommendations() que recebe o título de uma palestra, uma matriz de similaridade e uma série indices como argumentos, e retorna uma lista das palestras mais semelhantes. indices já foi fornecida para você.

Você também recebeu uma série transcripts que contém as transcrições de cerca de 500 TED Talks. Sua tarefa é gerar uma matriz de similaridade cosseno para os vetores tf-idf das transcrições.

Em seguida, vamos gerar recomendações para a palestra intitulada '5 ways to kill your dreams', da empreendedora brasileira Bel Pesce.

Este exercício faz parte do curso

Feature Engineering para NLP em Python

Ver curso

Instruções do exercício

  • Inicialize um TfidfVectorizer com stopwords em inglês. Dê a ele o nome tfidf.
  • Construa tfidf_matrix ajustando e transformando transcripts.
  • Gere a matriz de similaridade cosseno cosine_sim usando tfidf_matrix.
  • Use get_recommendations() para gerar recomendações para '5 ways to kill your dreams'.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Initialize the TfidfVectorizer 
tfidf = ____

# Construct the TF-IDF matrix
tfidf_matrix = ____

# Generate the cosine similarity matrix
cosine_sim = ____
 
# Generate recommendations 
print(get_recommendations(____, ____, indices))
Editar e executar o código