Rozpoznawanie encji nazwanych z NLTK

Czas pobawić się rozpoznawaniem encji nazwanych! W środowisku pracy został wcześniej wczytany artykuł ze strony internetowej. Twoim zadaniem jest użycie nltk do znalezienia encji nazwanych w tym artykule.

O czym może być artykuł, sądząc po znalezionych nazwach?

Oprócz nltk zaimportowano już sent_tokenize i word_tokenize z nltk.tokenize.

Podziel article na zdania.
Podziel każde zdanie z sentences na słowa, używając listy składanej.
Wewnątrz listy składanej otaguj każde stokenizowane zdanie częściami mowy za pomocą nltk.pos_tag().
Podziel każde otagowane zdanie na fragmenty encji nazwanych za pomocą nltk.ne_chunk_sents(). Oprócz pos_sentences podaj dodatkowy argument słowny binary=True.
Iteruj po każdym zdaniu i każdym fragmencie, a następnie sprawdź, czy jest to fragment encji nazwanej – zweryfikuj, czy posiada atrybut label oraz czy chunk.label() jest równe "NE". Jeśli tak, wyświetl ten fragment.

Exercise

Rozpoznawanie encji nazwanych z NLTK

Instructions

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Exercise

Instructions

Exercise