1. Learn
  2. /
  3. Courses
  4. /
  5. Wprowadzenie do przetwarzania języka naturalnego w Pythonie

Connected

Exercise

Rozpoznawanie encji nazwanych z NLTK

Czas pobawić się rozpoznawaniem encji nazwanych! W środowisku pracy został wcześniej wczytany artykuł ze strony internetowej. Twoim zadaniem jest użycie nltk do znalezienia encji nazwanych w tym artykule.

O czym może być artykuł, sądząc po znalezionych nazwach?

Oprócz nltk zaimportowano już sent_tokenize i word_tokenize z nltk.tokenize.

Instructions

100 XP
  • Podziel article na zdania.
  • Podziel każde zdanie z sentences na słowa, używając listy składanej.
  • Wewnątrz listy składanej otaguj każde stokenizowane zdanie częściami mowy za pomocą nltk.pos_tag().
  • Podziel każde otagowane zdanie na fragmenty encji nazwanych za pomocą nltk.ne_chunk_sents(). Oprócz pos_sentences podaj dodatkowy argument słowny binary=True.
  • Iteruj po każdym zdaniu i każdym fragmencie, a następnie sprawdź, czy jest to fragment encji nazwanej – zweryfikuj, czy posiada atrybut label oraz czy chunk.label() jest równe "NE". Jeśli tak, wyświetl ten fragment.