1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

cvičení

Trenowanie modelu spaCy od zera

spaCy oferuje przejrzyste i wydajne podejście do trenowania własnych modeli. W tym ćwiczeniu wytrenujemy model NER od zera na rzeczywistym korpusie (dane CORD-19).

Dane treningowe są dostępne w odpowiednim formacie jako training_data. Skorzystasz z podanej listy etykiet ("Pathogen", "MedicalCondition", "Medicine") zapisanej w zmiennej labels, używając pustego modelu języka angielskiego (nlp) z komponentem NER. Docelowe etykiety medyczne zostaną dodane do potoku NER, a następnie model zostanie wytrenowany przez jedną epokę. Możesz użyć wstępnie zaimportowanej klasy Example, aby przekształcić dane treningowe do wymaganego formatu. Aby śledzić postęp trenowania, dodaj listę losses do metody .update() i monitoruj stratę treningową.

Pokyny

100 XP
  • Utwórz pusty model spaCy i dodaj do niego komponent NER.
  • Wyłącz pozostałe komponenty potoku, użyj utworzonego obiektu optimizer i zaktualizuj wagi modelu, korzystając z danych przekształconych do formatu Example.