1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

Trenowanie istniejącego modelu NER

Model spaCy może nie działać dobrze na określonych danych. Jednym z rozwiązań jest dotrenowanie modelu na własnych danych. W tym ćwiczeniu przećwiczysz trenowanie modelu NER w celu poprawy jego skuteczności przewidywania.

Model spaCy en_core_web_sm dostępny jako nlp nie jest w stanie poprawnie rozpoznać house jako encji w ciągu test.

Mając do dyspozycji training_data, zapisz kroki potrzebne do zaktualizowania modelu, iterując przez dane dwa razy. Pozostałe komponenty pipeline są już wyłączone, a optimizer jest gotowy do użycia. Liczba epok jest już ustawiona na 2.

Instrukcje

100 XP
  • Użyj obiektu optimizer i dla każdej epoki przetasuj zbiór danych za pomocą pakietu random, a następnie utwórz obiekt Example.
  • Zaktualizuj model nlp za pomocą atrybutu .update i ustaw argument sgd tak, aby korzystał z optymalizatora.