1. Learn
  2. /
  3. Courses
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

Exercise

Dodawanie komponentów do potoku w spaCy

Do różnych zadań NLP często korzysta się z gotowych modeli spaCy. Jednak w niektórych przypadkach standardowy komponent potoku, taki jak segmentacja zdań, może działać zbyt wolno. W tym ćwiczeniu przećwiczysz dodawanie komponentu do modelu spaCy (potoku przetwarzania tekstu).

W ćwiczeniu wykorzystasz pięć pierwszych recenzji z zbioru danych Amazon Fine Food Reviews. Dostęp do tych recenzji uzyskasz za pomocą zmiennej texts.

Pakiet spaCy jest już zaimportowany i gotowy do użycia.

Instructions

100 XP
  • Wczytaj pusty angielski model spaCy i dodaj do niego komponent sentencizer.
  • Utwórz kontener Doc dla zmiennej texts, stwórz listę przechowującą sentences danego dokumentu i wyświetl liczbę zdań.
  • Wyświetl listę tokenów z drugiego zdania z listy sentences.