1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Feature Engineering for NLP in Python

Connected

cvičení

Doporučovač TED přednášek

V tomto cvičení sestavíme doporučovací systém, který navrhuje TED přednášky na základě jejich přepisů. Máš k dispozici funkci get_recommendations(), která přijímá název přednášky, matici podobnosti a sérii indices jako argumenty a vrací seznam nejpodobnějších přednášek. Série indices je už připravena.

Máš také k dispozici sérii transcripts obsahující přepisy přibližně 500 TED přednášek. Tvým úkolem je vygenerovat matici kosinové podobnosti pro tf-idf vektory přepisů přednášek.

Na závěr vygenerujeme doporučení pro přednášku s názvem '5 ways to kill your dreams' brazilské podnikatelky Bel Pesce.

Pokyny

100 XP
  • Inicializuj TfidfVectorizer s anglickými stop slovy a pojmenuj ho tfidf.
  • Vytvoř tfidf_matrix tak, že na transcripts zavoláš fit a transform.
  • Vygeneruj matici kosinové podobnosti cosine_sim pomocí tfidf_matrix.
  • Pomocí get_recommendations() získej doporučení pro '5 ways to kill your dreams'.