1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

Tokenizacja za pomocą spaCy

W tym ćwiczeniu przećwiczysz tokenizację tekstu. Skorzystasz z pierwszej recenzji z zbioru danych Amazon Fine Food Reviews. Dostęp do tej recenzji uzyskasz za pomocą dostarczonego obiektu text.

Model en_core_web_sm jest już wczytany. Możesz się do niego odwołać, wywołując nlp(). Do tworzenia list wynikowych możesz użyć wyrażeń listowych.

Instrukcje

100 XP
  • Zapisz kontener Doc dla wczytanej recenzji w obiekcie document.
  • Zapisz teksty wszystkich tokenów z obiektu document w zmiennej first_text_tokens i wyświetl je.