1. Nauka
  2. /
  3. Kursy
  4. /
  5. Tworzenie chatbotów w Pythonie

Connected

ćwiczenie

Rozpoznawanie encji za pomocą spaCy

W tym ćwiczeniu użyjesz wbudowanego modułu rozpoznawania encji biblioteki spaCy, aby wyodrębniać imiona i nazwiska, daty oraz nazwy organizacji z zapytań wyszukiwania. Biblioteka spaCy została już zaimportowana, a jej angielski model wczytano jako nlp.

Twoim zadaniem jest zdefiniowanie funkcji o nazwie extract_entities(), która przyjmuje jeden argument – message – i zwraca słownik, w którym kluczami są typy wykrytych encji, a wartościami – same encje. Interesujące nas typy encji są przechowywane na liście include_entities.

Instrukcje

100 XP
  • Utwórz słownik ents do przechowywania encji, wywołując dict.fromkeys() z include_entities jako jedynym argumentem.
  • Utwórz dokument spacy o nazwie doc, przekazując message do obiektu nlp.
  • Iteruj po encjach w dokumencie (doc.ents).
  • Sprawdź, czy atrybut .label_ danej encji należy do tych, które nas interesują. Jeśli tak, przypisz atrybut .text tej encji do odpowiedniego klucza w słowniku ents.