1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie głębokie dla tekstu z PyTorch

Connected

ćwiczenie

Stosowanie TF-IDF do opisów książek

Firma PyBooks zebrała opisy kilku książek i chce zidentyfikować w nich ważne słowa za pomocą techniki kodowania TF-IDF. Dzięki temu ma nadzieję lepiej poznać unikalne cechy każdej książki i usprawnić swój system rekomendacji.

Następujące pakiety zostały już zaimportowane: torch, torchtext.

Instrukcje

100 XP
  • Zaimportuj klasę TfidfVectorizer z modułu sklearn.feature_extraction.text – przekształca ona zbiór surowych dokumentów na macierz cech TF-IDF.
  • Utwórz instancję tej klasy, a następnie użyj jej do zakodowania zmiennej descriptions w macierz wektorów TF-IDF.
  • Pobierz i wyświetl pierwsze pięć nazw cech z obiektu vectorizer oraz pierwsze pięć zakodowanych wektorów z tfidf_encoded_descriptions.