1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

Rozpoznawanie encji nazwanych (NER) w spaCy

Rozpoznawanie encji nazwanych (NER) pozwala łatwo identyfikować kluczowe elementy dokumentu – takie jak imiona osób czy nazwy miejsc. Ułatwia porządkowanie nieustrukturyzowanych danych i wykrywanie ważnych informacji, co ma szczególne znaczenie przy pracy z dużymi zbiorami danych. W tym ćwiczeniu przećwiczysz rozpoznawanie encji nazwanych.

Model en_core_web_sm został załadowany jako nlp. W liście o nazwie texts znajdziesz trzy komentarze z zestawu danych Airline Travel Information System (ATIS).

Instrukcje

100 XP
  • Utwórz listę documents zawierającą kontenery Doc dla każdego tekstu z listy texts – użyj do tego wyrażenia listowego (list comprehension).
  • Dla każdego kontenera doc wypisz tekst każdej encji oraz odpowiadającą jej etykietę, iterując po doc.ents.
  • Wypisz tekst szóstego tokenu oraz typ encji drugiego kontenera Doc.