CommencerCommencer gratuitement

Système de recommandation de conférences TED

Dans cet exercice, vous allez construire un système de recommandation qui propose des conférences TED à partir de leurs transcriptions. Une fonction get_recommendations() vous est fournie : elle prend en entrée le titre d’une conférence, une matrice de similarité et une série indices, puis renvoie une liste des conférences les plus similaires. La série indices vous a déjà été fournie.

Vous disposez aussi d’une série transcripts qui contient les transcriptions d’environ 500 conférences TED. Votre tâche est de générer une matrice de similarité cosinus pour les vecteurs tf-idf des transcriptions.

Nous générerons ensuite des recommandations pour une conférence intitulée « 5 ways to kill your dreams » par l’entrepreneure brésilienne Bel Pesce.

Cet exercice fait partie du cours

Feature Engineering pour le NLP en Python

Afficher le cours

Instructions

  • Initialisez un TfidfVectorizer avec les stopwords anglais. Nommez-le tfidf.
  • Construisez tfidf_matrix en ajustant et en transformant transcripts.
  • Générez la matrice de similarité cosinus cosine_sim à partir de tfidf_matrix.
  • Utilisez get_recommendations() pour produire des recommandations pour « 5 ways to kill your dreams ».

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Initialize the TfidfVectorizer 
tfidf = ____

# Construct the TF-IDF matrix
tfidf_matrix = ____

# Generate the cosine similarity matrix
cosine_sim = ____
 
# Generate recommendations 
print(get_recommendations(____, ____, indices))
Modifier et exécuter le code