1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie głębokie dla tekstu z PyTorch

Connected

ćwiczenie

Model Bag-of-Words dla tytułów książek

PyBooks posiada teraz listę tytułów książek, które trzeba zakodować do dalszej analizy. Zespół ds. danych uważa, że model Bag of Words (BoW) będzie najlepszym podejściem.

Następujące pakiety zostały już zaimportowane: torch, torchtext.

Instrukcje

100 XP
  • Zaimportuj klasę CountVectorizer do implementacji modelu bag-of-words.
  • Zainicjalizuj obiekt zaimportowanej klasy, a następnie użyj go do przekształcenia listy titles w reprezentację macierzową.
  • Wyodrębnij i wyświetl pięć pierwszych nazw cech oraz zakodowane tytuły, korzystając z metody get_feature_names_out().