1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech dla NLP w Pythonie

Connected

ćwiczenie

System rekomendacji wykładów TED

W tym ćwiczeniu zbudujesz system rekomendacji sugerujący wykłady TED na podstawie ich transkryptów. Otrzymujesz funkcję get_recommendations(), która przyjmuje tytuł wykładu, macierz podobieństwa oraz serię indices jako argumenty, a następnie zwraca listę najbardziej podobnych wykładów. Seria indices jest już dla ciebie dostępna.

Otrzymujesz również serię transcripts zawierającą transkrypty około 500 wykładów TED. Twoim zadaniem jest wygenerowanie macierzy podobieństwa cosinusowego dla wektorów tf-idf transkryptów.

Na tej podstawie wygenerujemy rekomendacje dla wykładu zatytułowanego '5 ways to kill your dreams' brazylijskiej przedsiębiorczyni Bel Pesce.

Instrukcje

100 XP
  • Zainicjalizuj TfidfVectorizer z angielskimi stop słowami. Nadaj mu nazwę tfidf.
  • Skonstruuj tfidf_matrix, dopasowując i transformując serię transcripts.
  • Wygeneruj macierz podobieństwa cosinusowego cosine_sim na podstawie tfidf_matrix.
  • Użyj funkcji get_recommendations(), aby wygenerować rekomendacje dla '5 ways to kill your dreams'.