Recomendador de charlas TED
En este ejercicio, vamos a construir un sistema de recomendación que sugiera charlas TED basadas en sus transcripciones. Se te ha proporcionado una función get_recommendations() que recibe como argumentos el título de una charla, una matriz de similitud y una serie indices, y devuelve una lista de las charlas más similares. indices ya está disponible.
También se te ha dado una serie transcripts que contiene las transcripciones de unas 500 charlas TED. Tu tarea es generar una matriz de similitud coseno para los vectores tf-idf de las transcripciones.
A continuación, generaremos recomendaciones para una charla titulada '5 ways to kill your dreams' de la emprendedora brasileña Bel Pesce.
Este ejercicio forma parte del curso
Ingeniería de características para NLP en Python
Instrucciones del ejercicio
- Inicializa un
TfidfVectorizercon stopwords en inglés. Llámalotfidf. - Construye
tfidf_matrixajustando y transformandotranscripts. - Genera la matriz de similitud coseno
cosine_simusandotfidf_matrix. - Usa
get_recommendations()para generar recomendaciones para '5 ways to kill your dreams'.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Initialize the TfidfVectorizer
tfidf = ____
# Construct the TF-IDF matrix
tfidf_matrix = ____
# Generate the cosine similarity matrix
cosine_sim = ____
# Generate recommendations
print(get_recommendations(____, ____, indices))