1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Feature Engineering for NLP in Python

Connected

cvičení

tf-idf vektory pro TED talks

V tomto cvičení máš k dispozici korpus ted, který obsahuje přepisy 500 TED Talks. Tvým úkolem je vygenerovat tf-idf vektory pro tyto přednášky.

V další lekci použijeme tyto vektory k doporučování podobných přednášek na základě jejich přepisů.

Pokyny

100 XP
  • Importuj TfidfVectorizer z knihovny sklearn.
  • Vytvoř objekt TfidfVectorizer a pojmenuj ho vectorizer.
  • Pomocí metody fit_transform() vygeneruj tfidf_matrix pro ted.