1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

Podobieństwo semantyczne w kategoryzacji tekstu

Głównym celem podobieństwa semantycznego jest mierzenie odległości między znaczeniami pary słów, fraz, zdań lub dokumentów. Na przykład słowo „car" jest bardziej podobne do „bus" niż do „cat". W tym ćwiczeniu znajdziesz zdania podobne do słowa sauce w przykładowym tekście z Amazon Fine Food Reviews. Biblioteka spacy umożliwia obliczenie oceny podobieństwa słowa sauce do każdego zdania w danym ciągu texts i wskazanie wyniku dla najbardziej podobnego zdania.

Ciąg texts jest już załadowany i zawiera dane z pola Text wszystkich recenzji. W tym ćwiczeniu użyjesz modelu angielskiego en_core_web_md, który jest już dostępny jako nlp.

Instrukcje

100 XP
  • Użyj nlp, aby wygenerować kontenery Doc dla słowa sauce oraz dla texts i przypisz je odpowiednio do key i sentences.
  • Oblicz oceny podobieństwa słowa sauce do każdego zdania w ciągu texts (zaokrąglone do dwóch miejsc po przecinku).