1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech dla NLP w Pythonie

Connected

ćwiczenie

Wektory tf-idf dla wystąpień TED

W tym ćwiczeniu otrzymujesz korpus ted zawierający transkrypcje 500 wystąpień TED. Twoim zadaniem jest wygenerowanie wektorów tf-idf dla tych wystąpień.

W kolejnej lekcji wykorzystasz te wektory do budowy systemu rekomendacji podobnych wystąpień na podstawie ich transkrypcji.

Instrukcje

100 XP
  • Zaimportuj TfidfVectorizer z biblioteki sklearn.
  • Utwórz obiekt TfidfVectorizer i nadaj mu nazwę vectorizer.
  • Wygeneruj tfidf_matrix dla ted, używając metody fit_transform().