Consigliere di TED Talk
In questo esercizio costruirai un sistema di raccomandazione che suggerisce TED Talks in base alle loro trascrizioni. Ti è stata fornita una funzione get_recommendations() che accetta il titolo di un talk, una matrice di similarità e una serie indices come argomenti, e restituisce un elenco dei talk più simili. indices ti è già stata fornita.
Ti è stata anche fornita una serie transcripts che contiene le trascrizioni di circa 500 TED Talk. Il tuo compito è generare una matrice di similarità coseno per i vettori tf-idf delle trascrizioni dei talk.
Di conseguenza, genereremo raccomandazioni per un talk intitolato '5 ways to kill your dreams' dell'imprenditrice brasiliana Bel Pesce.
Questo esercizio fa parte del corso
Feature Engineering per NLP in Python
Istruzioni dell'esercizio
- Inizializza un
TfidfVectorizercon stopwords inglesi. Chiamalotfidf. - Costruisci
tfidf_matrixfacendo fit e transform ditranscripts. - Genera la matrice di similarità coseno
cosine_simusandotfidf_matrix. - Usa
get_recommendations()per generare raccomandazioni per '5 ways to kill your dreams'.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Initialize the TfidfVectorizer
tfidf = ____
# Construct the TF-IDF matrix
tfidf_matrix = ____
# Generate the cosine similarity matrix
cosine_sim = ____
# Generate recommendations
print(get_recommendations(____, ____, indices))