1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech dla NLP w Pythonie

Connected

ćwiczenie

Silnik rekomendacji na podstawie fabuły

W tym ćwiczeniu zbudujesz silnik rekomendacji, który sugeruje filmy na podstawie podobieństwa fabuły. Otrzymujesz funkcję get_recommendations(), która przyjmuje tytuł filmu, macierz podobieństwa oraz serię indices jako argumenty i zwraca listę najbardziej podobnych filmów. Seria indices jest już dostępna.

Otrzymujesz również serię movie_plots zawierającą opisy fabuły kilku filmów. Twoim zadaniem jest wygenerowanie macierzy podobieństwa cosinusowego dla wektorów tf-idf tych opisów.

Na koniec sprawdzimy skuteczność naszego silnika, generując rekomendacje dla jednego z moich ulubionych filmów – Mroczny Rycerz Powstaje.

Instrukcje

100 XP
  • Zainicjalizuj TfidfVectorizer z angielskimi stop_words. Nadaj mu nazwę tfidf.
  • Utwórz tfidf_matrix, dopasowując i transformując dane z opisami fabuły filmów za pomocą fit_transform().
  • Wygeneruj macierz podobieństwa cosinusowego cosine_sim na podstawie tfidf_matrix. Nie używaj cosine_similarity()!
  • Użyj get_recommendations(), aby wygenerować rekomendacje dla 'The Dark Knight Rises'.