1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

Segmentacja zdań w spaCy

W tym ćwiczeniu przećwiczysz segmentację zdań. W NLP podział dokumentu na zdania to przydatna operacja bazowa – jeden z pierwszych kroków w wielu bardziej złożonych zadaniach, takich jak wykrywanie nazwanych encji. Ponadto zliczenie zdań może dać pewien wgląd w ilość informacji zawartych w tekście.

Masz dostęp do dziesięciu recenzji jedzenia w liście o nazwie texts.

Model en_core_web_sm został już wczytany jako nlp i .

Instrukcje

100 XP
  • Uruchom model spaCy na każdym elemencie listy texts, aby zbudować documents – listę wszystkich kontenerów Doc.
  • Wyodrębnij zdania z każdego kontenera doc, iterując po liście documents, i dodaj je do listy o nazwie sentences.
  • Policz liczbę zdań w każdym kontenerze doc, korzystając z listy sentences.