1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Deep Learning for Text with PyTorch

Connected

cvičení

Použití TF-IDF na popisy knih

PyBooks shromáždil několik popisů knih a chce v nich identifikovat důležitá slova pomocí techniky kódování TF-IDF. Díky tomu doufají, že lépe porozumí jedinečným vlastnostem každé knihy a zlepší svůj systém doporučování knih.

Následující balíčky už jsou za tebe naimportovány: torch, torchtext.

Pokyny

100 XP
  • Importuj třídu TfidfVectorizer z sklearn.feature_extraction.text, která převádí kolekci surových dokumentů na matici TF-IDF příznaků.
  • Vytvoř instanci této třídy a pomocí ní zakóduj descriptions do TF-IDF matice vektorů.
  • Načti a zobraz prvních pět názvů příznaků z vectorizer a zakódovaných vektorů z tfidf_encoded_descriptions.