TED Talk-aanbeveler
In deze oefening bouw je een aanbevelingssysteem dat TED Talks suggereert op basis van hun transcripties. Je hebt een functie get_recommendations() gekregen die de titel van een talk, een similariteitsmatrix en een indices-reeks als argumenten neemt, en een lijst met meest vergelijkbare talks teruggeeft. indices is al voor je beschikbaar gesteld.
Je hebt ook een transcripts-reeks gekregen met de transcripties van ongeveer 500 TED Talks. Jouw taak is om een cosinus-similariteitsmatrix te genereren voor de tf-idf-vectoren van de transcripties.
Vervolgens genereren we aanbevelingen voor een talk met de titel '5 ways to kill your dreams' van de Braziliaanse ondernemer Bel Pesce.
Deze oefening maakt deel uit van de cursus
Feature Engineering voor NLP in Python
Oefeninstructies
- Initialiseer een
TfidfVectorizermet Engelse stopwoorden. Noem dezetfidf. - Bouw
tfidf_matrixdoortranscriptste fitten en te transformeren. - Genereer de cosinus-similariteitsmatrix
cosine_simmet behulp vantfidf_matrix. - Gebruik
get_recommendations()om aanbevelingen te genereren voor '5 ways to kill your dreams'.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Initialize the TfidfVectorizer
tfidf = ____
# Construct the TF-IDF matrix
tfidf_matrix = ____
# Generate the cosine similarity matrix
cosine_sim = ____
# Generate recommendations
print(get_recommendations(____, ____, indices))