IniziaInizia gratis

Consigliere di TED Talk

In questo esercizio costruirai un sistema di raccomandazione che suggerisce TED Talks in base alle loro trascrizioni. Ti è stata fornita una funzione get_recommendations() che accetta il titolo di un talk, una matrice di similarità e una serie indices come argomenti, e restituisce un elenco dei talk più simili. indices ti è già stata fornita.

Ti è stata anche fornita una serie transcripts che contiene le trascrizioni di circa 500 TED Talk. Il tuo compito è generare una matrice di similarità coseno per i vettori tf-idf delle trascrizioni dei talk.

Di conseguenza, genereremo raccomandazioni per un talk intitolato '5 ways to kill your dreams' dell'imprenditrice brasiliana Bel Pesce.

Questo esercizio fa parte del corso

Feature Engineering per NLP in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Inizializza un TfidfVectorizer con stopwords inglesi. Chiamalo tfidf.
  • Costruisci tfidf_matrix facendo fit e transform di transcripts.
  • Genera la matrice di similarità coseno cosine_sim usando tfidf_matrix.
  • Usa get_recommendations() per generare raccomandazioni per '5 ways to kill your dreams'.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Initialize the TfidfVectorizer 
tfidf = ____

# Construct the TF-IDF matrix
tfidf_matrix = ____

# Generate the cosine similarity matrix
cosine_sim = ____
 
# Generate recommendations 
print(get_recommendations(____, ____, indices))
Modifica ed esegui il codice