ComenzarEmpieza gratis

Recomendador de charlas TED

En este ejercicio, vamos a construir un sistema de recomendación que sugiera charlas TED basadas en sus transcripciones. Se te ha proporcionado una función get_recommendations() que recibe como argumentos el título de una charla, una matriz de similitud y una serie indices, y devuelve una lista de las charlas más similares. indices ya está disponible.

También se te ha dado una serie transcripts que contiene las transcripciones de unas 500 charlas TED. Tu tarea es generar una matriz de similitud coseno para los vectores tf-idf de las transcripciones.

A continuación, generaremos recomendaciones para una charla titulada '5 ways to kill your dreams' de la emprendedora brasileña Bel Pesce.

Este ejercicio forma parte del curso

Ingeniería de características para NLP en Python

Ver curso

Instrucciones del ejercicio

  • Inicializa un TfidfVectorizer con stopwords en inglés. Llámalo tfidf.
  • Construye tfidf_matrix ajustando y transformando transcripts.
  • Genera la matriz de similitud coseno cosine_sim usando tfidf_matrix.
  • Usa get_recommendations() para generar recomendaciones para '5 ways to kill your dreams'.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Initialize the TfidfVectorizer 
tfidf = ____

# Construct the TF-IDF matrix
tfidf_matrix = ____

# Generate the cosine similarity matrix
cosine_sim = ____
 
# Generate recommendations 
print(get_recommendations(____, ____, indices))
Editar y ejecutar código