1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

Podobieństwo dokumentów w spaCy

Podobieństwo semantyczne polega na analizie wielu zdań w celu wykrycia zależności między nimi. W tym ćwiczeniu przećwiczysz obliczanie podobieństwa semantycznego dokumentów względem wskazanego dokumentu bazowego. Celem jest kategoryzacja listy recenzji powiązanych z karmą dla psów w puszce.

Kategoria karma dla psów w puszce jest przechowywana w zmiennej category. Próbka pięciu recenzji żywności została dostarczona w liście o nazwie texts. Model en_core_web_md jest załadowany jako nlp.

Instrukcje

100 XP
  • Utwórz listę documents zawierającą obiekty Doc dla wszystkich elementów listy texts.
  • Utwórz obiekt Doc dla zmiennej category i zapisz go jako category_document.
  • Przejdź przez elementy listy documents i wyświetl wyniki podobieństwa każdego obiektu Doc względem category_document, zaokrąglone do trzech miejsc po przecinku.