1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

Podobieństwo obiektów Span w spaCy

Wyznaczanie podobieństwa semantycznego przydaje się do kategoryzowania tekstów, wykrywania treści powiązanych z danym tematem oraz identyfikowania duplikatów. W tym ćwiczeniu przećwiczysz obliczanie podobieństwa semantycznego fragmentów dokumentu (Span) względem zadanego dokumentu. Twoim celem jest znalezienie najbardziej trafnego obiektu Span złożonego z trzech tokenów, który odpowiada pojęciu karmione psie jedzenie w puszce.

Zadana kategoria karmionego psiego jedzenia w puszce jest przechowana w zmiennej category. Tekst jest już zapisany w obiekcie text, a model en_core_web_md został załadowany jako nlp. Kontener Doc dla zmiennej text został również już utworzony i zapisany w zmiennej document.

Instrukcje

100 XP
  • Utwórz kontener Doc dla zmiennej category i zapisz go w zmiennej category_document.
  • Wyświetl wynik podobieństwa dla danego obiektu Span i zmiennej category_document, zaokrąglony do trzech miejsc po przecinku.