Aan de slagGa gratis aan de slag

TED Talk-aanbeveler

In deze oefening bouw je een aanbevelingssysteem dat TED Talks suggereert op basis van hun transcripties. Je hebt een functie get_recommendations() gekregen die de titel van een talk, een similariteitsmatrix en een indices-reeks als argumenten neemt, en een lijst met meest vergelijkbare talks teruggeeft. indices is al voor je beschikbaar gesteld.

Je hebt ook een transcripts-reeks gekregen met de transcripties van ongeveer 500 TED Talks. Jouw taak is om een cosinus-similariteitsmatrix te genereren voor de tf-idf-vectoren van de transcripties.

Vervolgens genereren we aanbevelingen voor een talk met de titel '5 ways to kill your dreams' van de Braziliaanse ondernemer Bel Pesce.

Deze oefening maakt deel uit van de cursus

Feature Engineering voor NLP in Python

Cursus bekijken

Oefeninstructies

  • Initialiseer een TfidfVectorizer met Engelse stopwoorden. Noem deze tfidf.
  • Bouw tfidf_matrix door transcripts te fitten en te transformeren.
  • Genereer de cosinus-similariteitsmatrix cosine_sim met behulp van tfidf_matrix.
  • Gebruik get_recommendations() om aanbevelingen te genereren voor '5 ways to kill your dreams'.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Initialize the TfidfVectorizer 
tfidf = ____

# Construct the TF-IDF matrix
tfidf_matrix = ____

# Generate the cosine similarity matrix
cosine_sim = ____
 
# Generate recommendations 
print(get_recommendations(____, ____, indices))
Code bewerken en uitvoeren