1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Feature Engineering for NLP in Python

Connected

cvičení

Doporučovací engine na základě děje

V tomto cvičení vytvoříš doporučovací engine, který navrhuje filmy na základě podobnosti jejich dějových linií. K dispozici máš funkci get_recommendations(), která jako argumenty přijímá název filmu, matici podobnosti a sérii indices a vrací seznam nejpodobnějších filmů. Série indices je již připravena.

Máš také k dispozici sérii movie_plots, která obsahuje dějové linie několika filmů. Tvým úkolem je vygenerovat matici kosinové podobnosti pro tf-idf vektory těchto dějů.

Nakonec ověříme sílu našeho enginu tím, že vygenerujeme doporučení pro jeden z mých oblíbených filmů — Temný rytíř povstal.

Pokyny

100 XP
  • Inicializuj TfidfVectorizer s anglickými stop_words. Pojmenuj ho tfidf.
  • Vytvoř tfidf_matrix tak, že na data dějových linií filmů aplikuješ fit_transform().
  • Vygeneruj matici kosinové podobnosti cosine_sim pomocí tfidf_matrix. Nepoužívej cosine_similarity()!
  • Pomocí get_recommendations() vygeneruj doporučení pro 'The Dark Knight Rises'.